【AI News】OpenAI揭示了DALL-E 3文本到图像模型
OpenAI宣布了DALL-E 3,这是其备受赞誉的文本到图像模型的第三代。 DALL-E 3承诺在其前身基础上带来显著的增强,同时引入了与ChatGPT的无缝集成。 DALL-E 3的一项突出特点是在面对详细和长篇的提示时,更好地理解和解释用户意图的能力:
提示词: "一名年中年的亚洲血统女性,她深色的头发带有银色条纹,看起来好像被打碎和分裂,精致地嵌入在一片破碎的瓷器海洋中。瓷器上闪烁着斑点涂料的图案,以光滑和哑光的蓝色、绿色、橙色和红色和谐交织,捕捉到她在超现实的运动和静止之间的舞蹈。她的皮肤色调,像瓷器一样浅,为她的形象增添了一种几乎神秘的质感。" 得到的图如下:
即使用户难以精确表达他们的愿景,ChatGPT也可以介入协助构建全面的提示。 DALL-E 3经过精心设计,擅长创建其前身和其他人工智能生成器在过去一直难以胜任的元素,例如细致描绘手部和将文本融入图像中:
提示词: 一幅由半透明玻璃制成的人类心脏的插图,矗立在汹涌的海洋中的底座上。阳光穿透云层,照亮了心脏,揭示了其中一个微小的宇宙。引语“在你内心找到宇宙”以粗体字刻在地平线上。 得到的图如下:
OpenAI还实施了强大的安全措施,通过识别和忽略提示中的某些关键词,确保AI系统不会生成明确或冒犯性的内容。
除了技术上的进步,OpenAI还采取措施来减轻潜在的法律问题。
尽管当前的DALL-E版本可以模仿现实艺术家的风格,但即将推出的DALL-E 3已经设计成拒绝复制他们的受版权保护的作品的请求。艺术家还可以通过OpenAI网站上的专用表单提交他们的原创作品,以便在有必要时请求删除。
OpenAI针对DALL-E 3的推出计划包括下个月首次向ChatGPT 'Plus'和'Enterprise'客户发布。然后,这个增强的图像生成器将在即将到来的秋季季节提供给OpenAI的研究实验室和API客户。
随着OpenAI继续推动人工智能技术的界限,DALL-E 3代表了文本到图像生成的一个重大进步。