Image: Adobe
据悉,Adobe全力支持人工智能,宣布了三种新的生成人工智能模型,为Illustrator和Adobe Express添加了强大的功能,并大大提高了Photoshop的文本到图像功能。在近日的Adobe Max活动中,Adobe推出了Firefly Image 2模型,这是最初Firefly AI图像生成器的最新版本,支持Photoshop的Generative Fill等流行功能,同时推出了两个用于生成矢量图像和设计模板的新Firefly模型。
Adobe表示,与前代相比,其新的Firefly Image 2模型生成的图像质量明显更高,尤其是在渲染真实感人类时,在皮肤纹理、头发、手和面部特征等高频细节方面。使用Firefly Image 2模型生成的图像具有更高的分辨率,并且具有更生动的颜色和颜色对比度。
Image: Adobe
Image 2模型还引入了新的人工智能编辑功能,帮助用户自定义结果。照片设置可以手动或自动调整生成图像的景深、运动模糊和视野,就像手动相机控制一样。还添加了“提示指导”功能,帮助用户改进文本描述的措辞,同时自动完成提示以提高效率。
Adobe还推出了一项新的“生成匹配”功能,该功能可以影响生成内容的风格,以匹配特定的图像。用户可以从预先选择的图像列表中进行选择,也可以上传自己的参考资料来复制样式,用滑块控制相似程度。内容凭证——一个数字“营养标签”,附加归因元数据,并将图像识别为人工智能生成——将自动附加到最终输出中。
Image: Adobe
Adobe的设计负责人Scott Belsky在一篇专门的博客文章中表示,该公司已经制定了“新的政策和保障措施”,以保护Generative Match不被滥用。该功能将提示用户同意Adobe的使用条款,并确认他们有权使用上传的图像,同时在Adobe的服务器上存储上传内容的缩略图(不用于训练人工智能模型),以提供一定程度的问责制。Generative Match在公司寻求反馈期间也将保持测试版,在此期间用户不得将其用于商业目的。
尽管如此,目前似乎几乎没有什么可以真正阻止用户模仿受保护的内容,这可能会在Adobe和反对人工智能复制其风格的创意人员之间造成更大的分歧。目前,这个系统似乎更多的是限制Adobe的责任,而不是从一开始就防止模仿行为。
Firefly Image 2今天可以通过基于网络的Firefly测试版进行试用,并且“很快”就会出现在创意云应用程序中。这意味着它还不能在Photoshop(标准版、测试版或网络版)中使用,但在我们等待它推出的同时,你至少可以将它与最初的Firefly image模型进行比较。
Adobe还为Adobe Illustrator推出了一个新的Firefly Vector模型,该公司声称这是“世界上第一个矢量图形的生成人工智能模型”。Adobe的Firefly Vector模型现已在Firefly beta中推出,用户可以使用文本提示创建可编辑的矢量图像,自动将图形的每个元素划分为“逻辑”组和层。与传统的JPEG和PNG文件不同,矢量图形(也称为SVG文件)非常适合logo设计师等创意人员,因为它们可以缩放到任何大小,而不会影响整体图像质量。
正如最初的Firefly文本到图像模型一样,Adobe表示,其Firefly Vecor模型的设计是为了安全地用于商业用途。Firefly Vector模型现在可以通过Adobe Illustrator测试版进行尝试,同时还有其他测试版功能,如Mockup(在3D模型上逼真地展示设计)和用于识别和编辑矢量字体的Retype。
最后,Adobe推出了Firefly Design模型,该模型可为打印、社交帖子、在线广告、视频等生成可定制的模板。Adobe的Firefly Design模型为Adobe Express中新的文本到模板测试版功能提供了动力,它使用文本提示为“所有流行的纵横比”生成完全可编辑的模板。它与Canva的Magic Design功能(另一个与Adobe Express竞争的一体化设计平台)有一些相似之处,用户可以描述类似于“海滩度假传单”的东西来生成独特的模板,而不是将单个文本和图像内容放在空白画布上。
好文章,需要你的鼓励
Intuit在ChatGPT发布后匆忙推出的聊天式AI助手遭遇失败,随后公司进行了为期九个月的战略转型。通过观察客户实际工作流程,发现手动转录发票等重复性劳动,决定用AI智能体自动化这些任务而非强加新的聊天行为。公司建立了三大支柱框架:培养构建者文化、高速迭代替代官僚主义、构建GenOS平台引擎。最终推出的QuickBooks支付智能体让小企业平均提前5天收到款项,每月节省12小时工作时间。
希伯来大学研究团队开发出MV-RAG系统,首次解决了AI在生成稀有物品3D模型时的"胡编乱造"问题。该系统像拥有图像记忆库的艺术家,能先搜索相关真实照片再生成准确3D视图。通过独创的混合训练策略和智能自适应机制,MV-RAG在处理罕见概念时性能显著超越现有方法,为游戏开发、影视制作、虚拟现实等领域提供了强大工具。
马斯克旗下xAI公司发布专为开发者设计的新AI模型grok-code-fast-1,主打快速且经济的推理能力。该模型属于Grok 4系列,具备自主处理任务的能力。xAI声称其在SWE-bench评测中解决了70.8%的实际软件问题,表现优于GPT-5和Claude 4。不过模型存在较高的不诚实率问题。用户可通过GitHub Copilot等平台免费试用7天,需要API密钥访问。
MBZUAI等机构研究团队通过一维细胞自动机实验揭示了AI模型多步推理的关键限制:固定深度模型在单步预测上表现优异,但多步推理能力急剧下降。研究发现增加模型深度比宽度更有效,自适应计算时间、强化学习和思维链训练能突破这些限制。这为开发更强推理能力的AI系统提供了重要指导,强调了真正推理与简单记忆的本质区别。