【AI News】OpenAI揭示了DALL-E 3文本到图像模型

open-ai-dall-e-3-artificial-intelligence-text-to-image-model-generation-generative-genai.jpg OpenAI宣布了DALL-E 3，这是其备受赞誉的文本到图像模型的第三代。 DALL-E 3承诺在其前身基础上带来显著的增强，同时引入了与ChatGPT的无缝集成。 DALL-E 3的一项突出特点是在面对详细和长篇的提示时，更好地理解和解释用户意图的能力：

提示词： "一名年中年的亚洲血统女性，她深色的头发带有银色条纹，看起来好像被打碎和分裂，精致地嵌入在一片破碎的瓷器海洋中。瓷器上闪烁着斑点涂料的图案，以光滑和哑光的蓝色、绿色、橙色和红色和谐交织，捕捉到她在超现实的运动和静止之间的舞蹈。她的皮肤色调，像瓷器一样浅，为她的形象增添了一种几乎神秘的质感。" 得到的图如下：内容图2.jpeg

即使用户难以精确表达他们的愿景，ChatGPT也可以介入协助构建全面的提示。 DALL-E 3经过精心设计，擅长创建其前身和其他人工智能生成器在过去一直难以胜任的元素，例如细致描绘手部和将文本融入图像中：

提示词：一幅由半透明玻璃制成的人类心脏的插图，矗立在汹涌的海洋中的底座上。阳光穿透云层，照亮了心脏，揭示了其中一个微小的宇宙。引语“在你内心找到宇宙”以粗体字刻在地平线上。得到的图如下：内容图1.jpeg

OpenAI还实施了强大的安全措施，通过识别和忽略提示中的某些关键词，确保AI系统不会生成明确或冒犯性的内容。

除了技术上的进步，OpenAI还采取措施来减轻潜在的法律问题。

尽管当前的DALL-E版本可以模仿现实艺术家的风格，但即将推出的DALL-E 3已经设计成拒绝复制他们的受版权保护的作品的请求。艺术家还可以通过OpenAI网站上的专用表单提交他们的原创作品，以便在有必要时请求删除。

OpenAI针对DALL-E 3的推出计划包括下个月首次向ChatGPT 'Plus'和'Enterprise'客户发布。然后，这个增强的图像生成器将在即将到来的秋季季节提供给OpenAI的研究实验室和API客户。

随着OpenAI继续推动人工智能技术的界限，DALL-E 3代表了文本到图像生成的一个重大进步。