Image: OpenAI
OpenAI宣布了其生成型AI视觉艺术平台DALL-E的第三个版本,该平台现在允许用户使用ChatGPT创建提示,并包括更多安全选项。
相较于前代产品,DALL-E3有着显著的提升,并实现了与ChatGPT的无缝集成。其突出特点在于面对详细而冗长的提示时,它能够更好地理解和解读用户的意图;即使用户难以准确表达自己的想法,ChatGPT也能够介入,协助生成全面的提示。
在The Verge的演示中,首席研究员兼DALL-E团队负责人Aditya Ramesh促使ChatGPT帮助他为山区的一家拉面餐厅设计一个标志。然后,ChatGPT写了一个更长的提示,DALL-E给出了四个选项。OpenAI表示,这种与聊天机器人的连接可以让更多的人创作人工智能艺术。虽然目前的DALL-E版本可以模仿在世艺术家的风格,但即将推出的DALL-E3在设计上将拒绝复制其版权作品的请求。艺术家们可以通过OpenAI网站上的专用表格提交他们的原创作品,以便在必要时请求删除。
DALL-E于2021年1月首次发布,先于Stability AI和Midtravel的其他文本到图像生成AI艺术平台。到2022年DALL-E 2发布时,OpenAI打开了一个等待名单,以控制谁可以使用该平台,因为有人批评DALL-E可以生成真实感的露骨图像,并在生成照片时显示出偏见。该公司于去年9月取消了候补名单,并向公众开放了DALL-E 2。
这个新版本的DALL-E将于10月首次向ChatGPT Plus和ChatGPT Enterprise用户发布,随后研究实验室及其API服务将于秋季发布。OpenAI计划错开DALL-E 3的发布时间,但没有承诺何时发布免费的公共版本。
好文章,需要你的鼓励
法国AI初创公司Mistral AI发布了首个大语言模型全面生命周期评估,量化了AI的环境代价。其Mistral Large 2模型训练产生20,400吨二氧化碳当量,消耗281,000立方米水。运营阶段占环境影响85%,远超硬件制造成本。研究表明地理位置和模型大小显著影响碳足迹,企业可通过选择适当规模模型、批处理技术和清洁能源部署来减少环境影响。这一透明度为企业AI采购决策提供了新的评估标准。
上海AI实验库推出YUME系统,用户只需输入一张图片就能创建可键盘控制的虚拟世界。该系统采用创新的运动量化技术,将复杂的三维控制简化为WASD键操作,并通过智能记忆机制实现无限长度的世界探索。系统具备强大的跨风格适应能力,不仅能处理真实场景,还能重现动漫、游戏等各种艺术风格的虚拟世界,为虚拟现实和交互娱乐领域提供了全新的技术路径。
许多人认为一旦实现通用人工智能(AGI)和人工智能超级智能(ASI),这些高度先进的AI将能够告诉我们人生的真正意义。然而,巅峰AI可能无法明确回答这个史诗般的问题。即使AI拥有人类所有知识,也不意味着能从中找到生命意义的答案。AI可能会选择提供多种可能性而非绝对答案,以避免分裂人类社会。
上海AI实验室研究团队开发了革命性的AI编程验证方法,让大语言模型能够在最小人工干预下自动生成和验证程序规范。该方法摒弃传统的人工标注训练,采用强化学习让模型在形式化语言空间中自主探索,在Dafny编程验证任务上显著超越现有方法,为AI自主学习开辟新道路。