Microsoft 终于在将 Copilot 转化为基础网页应用近一年后,推出了 Windows 原生版本的 Copilot 应用。本周,一个全新的 Copilot 应用正在向 Windows 预览版用户推出,该版本采用原生 XAML 构建,并包含了新的侧边栏和改进后的用户界面。
现在 Windows 版 Copilot 的设计与最近发布的 macOS 版 Copilot 应用保持一致,用户可以上传图片并生成图像或文本。此外,用户还可以使用麦克风与 Copilot 交互,并在更新后的侧边栏中访问对话历史记录。
Microsoft 最初将 Copilot 作为一个"个人助手"集成到 Windows 11 操作系统中,但一年后取消了这种集成方式,转而采用一个基础网页应用,这使得 Copilot 在新的 Copilot Plus PC 上的实用性降低。虽然软件开发商此前已经添加了键盘快捷键,并让 Copilot 应用看起来不那么像网页应用,但本周的更新在外观上有了很大改善。
这个全新的 Copilot 应用将首先通过 Microsoft Store 向所有 Windows 预览版用户推出,这意味着它将在未来几周内出现在所有 Windows 11 PC 上。
好文章,需要你的鼓励
Liquid AI发布了新一代视觉语言基础模型LFM2-VL,专为智能手机、笔记本电脑和嵌入式系统等设备高效部署而设计。该模型基于独特的LIV系统架构,GPU推理速度比同类模型快2倍,同时保持竞争性能。提供450M和1.6B两个版本,支持512×512原生分辨率图像处理,采用模块化架构结合语言模型和视觉编码器。模型已在Hugging Face平台开源发布。
AIM Intelligence联合多所知名大学揭示了音频AI系统的重大安全漏洞,开发出名为WhisperInject的攻击方法。这种攻击能让看似无害的音频指令操控AI生成危险内容,成功率超过86%,完全绕过现有安全机制。研究暴露了多模态AI系统的系统性安全风险,对全球数十亿智能设备构成潜在威胁。
阿里团队推出首个AI物理推理综合测试平台DeepPHY,通过六个物理环境全面评估视觉语言模型的物理推理能力。研究发现即使最先进的AI模型在物理预测和控制方面仍远落后于人类,揭示了描述性知识与程序性控制间的根本脱节,为AI技术发展指明了重要方向。
新加坡国立大学研究团队系统梳理了视觉强化学习领域的最新进展,涵盖超过200项代表性工作。研究将该领域归纳为四大方向:多模态大语言模型、视觉生成、统一模型框架和视觉-语言-动作模型,分析了从RLHF到可验证奖励范式的政策优化策略演进,并识别出样本效率、泛化能力和安全部署等关键挑战,为这一快速发展的交叉学科提供了完整的技术地图。