Microsoft 正在将其 Copilot AI 助手作为 Mac 应用提供。这款原生 macOS 应用将提供对 Microsoft 工具网页版本的访问。该应用从今天起在美国、英国和加拿大开始推出。从实际功能来看,这款应用的功能与访问 Copilot 网页版的体验基本相同。主要区别在于 Mac 应用包含了一个使用 Command + Space 激活 AI 助手的快捷键,并且可以在深色模式下显示。
本周早些时候,Microsoft 宣布将向所有用户免费开放 Copilot 的语音功能和深度思考功能,后者采用了 OpenAI 的 o1 模型。这两项举措似乎都旨在扩大 Copilot 的用户群。
科技巨头在尝试将其软件应用于竞争对手的硬件平台时,历来都充满挑战。有时,要让一项服务针对不同品牌的具体规格进行优化可能需要数年时间。而这次专门为 macOS 推出的 Copilot 应用(该应用已在 iPhone 和 iPad 上推出),可能是 Microsoft 有史以来将服务引入 Apple 生态系统最快的一次。
好文章,需要你的鼓励
Liquid AI发布了新一代视觉语言基础模型LFM2-VL,专为智能手机、笔记本电脑和嵌入式系统等设备高效部署而设计。该模型基于独特的LIV系统架构,GPU推理速度比同类模型快2倍,同时保持竞争性能。提供450M和1.6B两个版本,支持512×512原生分辨率图像处理,采用模块化架构结合语言模型和视觉编码器。模型已在Hugging Face平台开源发布。
AIM Intelligence联合多所知名大学揭示了音频AI系统的重大安全漏洞,开发出名为WhisperInject的攻击方法。这种攻击能让看似无害的音频指令操控AI生成危险内容,成功率超过86%,完全绕过现有安全机制。研究暴露了多模态AI系统的系统性安全风险,对全球数十亿智能设备构成潜在威胁。
阿里团队推出首个AI物理推理综合测试平台DeepPHY,通过六个物理环境全面评估视觉语言模型的物理推理能力。研究发现即使最先进的AI模型在物理预测和控制方面仍远落后于人类,揭示了描述性知识与程序性控制间的根本脱节,为AI技术发展指明了重要方向。
新加坡国立大学研究团队系统梳理了视觉强化学习领域的最新进展,涵盖超过200项代表性工作。研究将该领域归纳为四大方向:多模态大语言模型、视觉生成、统一模型框架和视觉-语言-动作模型,分析了从RLHF到可验证奖励范式的政策优化策略演进,并识别出样本效率、泛化能力和安全部署等关键挑战,为这一快速发展的交叉学科提供了完整的技术地图。