Image: OpenAI
OpenAI宣布了其生成型AI视觉艺术平台DALL-E的第三个版本,该平台现在允许用户使用ChatGPT创建提示,并包括更多安全选项。
相较于前代产品,DALL-E3有着显著的提升,并实现了与ChatGPT的无缝集成。其突出特点在于面对详细而冗长的提示时,它能够更好地理解和解读用户的意图;即使用户难以准确表达自己的想法,ChatGPT也能够介入,协助生成全面的提示。
在The Verge的演示中,首席研究员兼DALL-E团队负责人Aditya Ramesh促使ChatGPT帮助他为山区的一家拉面餐厅设计一个标志。然后,ChatGPT写了一个更长的提示,DALL-E给出了四个选项。OpenAI表示,这种与聊天机器人的连接可以让更多的人创作人工智能艺术。虽然目前的DALL-E版本可以模仿在世艺术家的风格,但即将推出的DALL-E3在设计上将拒绝复制其版权作品的请求。艺术家们可以通过OpenAI网站上的专用表格提交他们的原创作品,以便在必要时请求删除。
DALL-E于2021年1月首次发布,先于Stability AI和Midtravel的其他文本到图像生成AI艺术平台。到2022年DALL-E 2发布时,OpenAI打开了一个等待名单,以控制谁可以使用该平台,因为有人批评DALL-E可以生成真实感的露骨图像,并在生成照片时显示出偏见。该公司于去年9月取消了候补名单,并向公众开放了DALL-E 2。
这个新版本的DALL-E将于10月首次向ChatGPT Plus和ChatGPT Enterprise用户发布,随后研究实验室及其API服务将于秋季发布。OpenAI计划错开DALL-E 3的发布时间,但没有承诺何时发布免费的公共版本。
好文章,需要你的鼓励
本文介绍了 Agentic AI 的概念、特点及应用,强调其自主决策、分解任务与执行复杂目标的能力,并探讨了应用场景与潜在风险。
这项研究提出了一种名为"词汇偏向水印"(LBW)的新方法,专为自回归图像生成模型设计,能够抵抗传统水印技术容易被删除的重生成攻击。研究团队将代币库分为绿色和红色列表,通过软硬两种偏向策略鼓励模型在生成过程中选择绿色列表中的代币,并采用多绿色列表策略增强安全性。实验表明,LBW在多种攻击下展现出卓越的稳健性,尤其是在面对重生成攻击时表现突出,为AI生成内容的可追溯性提供了更可靠的技术保障。
本篇文章以 Navin Chaddha 的采访为主线,阐述了 AI 技术背后人际伙伴关系和早期合作的重要性,以及“协同智能即服务”的理念,强调未来创新依旧由人类主导,技术只是辅助工具。
南方科技大学林剑满团队开创性提出DGAD模型,解决通用物体组合中几何编辑与外观保持的双重挑战。该方法首先利用语义嵌入隐式捕捉物体几何特性,再通过密集交叉注意力机制精确对齐外观特征,成功实现物体在任意场景中的灵活编辑同时保持细节不变。实验表明,DGAD在编辑灵活性和外观保真度上均优于现有技术,为AR/VR内容创建等应用提供了强大工具。