根据 Adobe 数字媒体首席技术官 Ely Greenfield 今日发布的博客文章,Adobe 正在为 Photoshop 和 Premiere Pro 开发 AI 智能助手,这些助手不仅能为用户推荐照片或视频的编辑方案,还能自动完成相关编辑任务。
Photoshop 的智能 AI 助手(Adobe 称之为"创意助手")将以新的浮动操作面板的形式呈现。它会分析照片后推荐符合上下文的编辑建议。例如,它可以建议移除背景中的人物,或通过模糊主体背景来创造更强的景深效果。用户只需点击建议,系统就会自动执行这些操作。
长期使用 Photoshop 的用户都习惯于手动处理照片,需要繁琐地为人物和物体创建蒙版,然后建立图层来单独修改图片的特定部分。Adobe 已经添加了一些 AI 功能,如在更大画布上扩展和填充照片,或使用"干扰移除"功能删除背景中不需要的物体或人物。
Adobe 的愿景是让 Photoshop 用户能够使用自然语言与智能助手交互,这样可以更容易地学习完成任务所需的步骤(当然,智能助手仍然可以帮你完成这些任务)。用户可以持续向智能助手发出指令来进行更多修改,或在图层中手动调整。在一个示例视频中,有人要求智能助手清理图像并在人物背后添加文本框,智能助手随即列出了以下步骤:移除背景人物、自动调亮、移除干扰对象、创建"主体"图层、创建文本图层和组织图层。
对于 Premiere Pro,Adobe 将在上周推出的 Media Intelligence 功能基础上进行扩展。该功能可以分析视频中的物体和构图,帮助用户找到所需的镜头。未来的智能助手将允许用户指导它进行初步的视频剪辑。
Greenfield 在博客中写道:"虽然 AI 无法取代人类的创意灵感,但在有了你的输入后,它可以做出一些明智的猜测,帮助你启动项目。它还可以帮助你通过几个简单的按键来学习如何执行复杂的任务,帮助你成长为更好的编辑。" Premiere Pro 的创意助手最终将帮助编辑人员优化镜头选择、调整颜色、混音等。Adobe 还刚刚推出了 Generative Extend 功能,使用 AI 为视频片段添加几秒钟的内容,以帮助实现更好的转场效果。
Adobe 将在 4 月 24 日的伦敦 Max 活动上介绍第一个 AI 智能助手(Photoshop 版本)的相关技术。
好文章,需要你的鼓励
Liquid AI发布了新一代视觉语言基础模型LFM2-VL,专为智能手机、笔记本电脑和嵌入式系统等设备高效部署而设计。该模型基于独特的LIV系统架构,GPU推理速度比同类模型快2倍,同时保持竞争性能。提供450M和1.6B两个版本,支持512×512原生分辨率图像处理,采用模块化架构结合语言模型和视觉编码器。模型已在Hugging Face平台开源发布。
AIM Intelligence联合多所知名大学揭示了音频AI系统的重大安全漏洞,开发出名为WhisperInject的攻击方法。这种攻击能让看似无害的音频指令操控AI生成危险内容,成功率超过86%,完全绕过现有安全机制。研究暴露了多模态AI系统的系统性安全风险,对全球数十亿智能设备构成潜在威胁。
阿里团队推出首个AI物理推理综合测试平台DeepPHY,通过六个物理环境全面评估视觉语言模型的物理推理能力。研究发现即使最先进的AI模型在物理预测和控制方面仍远落后于人类,揭示了描述性知识与程序性控制间的根本脱节,为AI技术发展指明了重要方向。
新加坡国立大学研究团队系统梳理了视觉强化学习领域的最新进展,涵盖超过200项代表性工作。研究将该领域归纳为四大方向:多模态大语言模型、视觉生成、统一模型框架和视觉-语言-动作模型,分析了从RLHF到可验证奖励范式的政策优化策略演进,并识别出样本效率、泛化能力和安全部署等关键挑战,为这一快速发展的交叉学科提供了完整的技术地图。