Microsoft 365 Copilot迎来新团队成员,包括 Researcher 与 Analyst 代理。此次最新更新为 Microsoft 365 Copilot 引入了由 AI 驱动的搜索、所谓的推理代理以及全新的代理商店。部分用户已经能使用某些功能,而其他用户则可能需要等到五月才可体验。
其中一项新增功能是由 AI 驱动的企业搜索,这在过去曾因需要跨不同数据存储库应用策略以确保仅调用合适文件而令企业搜索供应商面临挑战。
“借助 Copilot 搜索,我们将搜索与 AI 的能力结合在一起,为您提供更相关、上下文感知的搜索结果,” Microsoft 设计与研究全球副总裁 Jon Friedman 在一段视频解说中表示。“它将您的工作数据与数十个应用连接起来,帮助您快速找到所需内容。而 Copilot 还可以对文件进行摘要,让您无需打开文档就能了解内容。”
对于担心让大语言模型在企业文件中乱翻的人来说,Microsoft 指出其 Copilot 控制系统,旨在让 IT 管理员和安全人员管理 Copilot 的交互和访问权限。
该系统包括 Purview 所支持的 AI 数据安全态势管理中的 Apps and Agents 部分,专门用于此类监管。此外,在 Microsoft Viva Insights 中还提供 Copilot 分析服务和 Copilot Studio 代理报告。
至于 AI 本身,Microsoft 365 Copilot 新增了两个角色: Researcher 和 Analyst。它们均为“推理代理”,即基于 OpenAI 的推理模型,尽管 Microsoft 尚未详细说明具体采用的是哪些模型。这里的“推理”指的是将任务分解为一步步并展示这些步骤执行过程的能力。
Researcher 代理旨在协助处理多步骤的研究任务,与 OpenAI 在二月份推出的深度研究代理类似。微软在演示视频中展示了使用以下提示让该代理制定市场营销计划的过程:
Create a marketing plan for the upcoming smart sneaker launch. Emphasize its ergonomic design, health tracking, and GPS integration. Make sure to include recommendations on the right digital channels and content strategy. Include insights from [the] competitive landscape and our past campaigns.
请为即将发布的智能运动鞋推出制定市场营销计划。重点突出其人体工程学设计、健康追踪和 GPS 集成。务必包含关于合适数字渠道和内容策略的推荐,并结合竞争态势和我们过往营销活动的洞察。
设想一下,你是一位雄心勃勃但不甚聪明的实习生,而你的顶尖营销团队因为跟随了推荐引擎建议体验一家流行的新潮贝类快闪店而集体食物中毒。此时,你会非常希望有像 Researcher 这样的代理为你草拟一份勉强过得去的营销计划,好让你能因此得到认可。
Analyst 代理在数据分析方面同样承诺实现类似的信息处理能力。
“一位未透露姓名的 Microsoft 员工在视频中解释道:‘Analyst 建立在 OpenAI 的 o3-mini 推理模型之上,并针对企业环境中的高级数据分析进行了优化,包括在何时以及如何使用 Python。’” “因此,即使你从未编写过一行代码,也可以获得只有 Python 才能提供的丰富数据洞察。”
或许你看不懂代码,但 Microsoft 的 AI 可以为你解释。显然,这是一个进步。
这些新代理现已在全新亮相的代理商店中上线,该店还展示了来自包括 Jira、Monday.com 和 Miro 等多家合作伙伴的产品。此外,还提供定制构建的代理,允许企业选择自动化执行特定任务或为 Copilot 提供对特定数据的访问权限。
各大模型提供商每年投入数十亿美元,以提升生成式 AI 模型的规模、性能和可靠性。这个悖论将持续到 2025 年和 2026 年。
在创作体验方面,Copilot 增添了 OpenAI GPT-4o 的图像生成功能,使其更加强大。无论是准设计专业人士,还是那些不愿意将其才华付诸实践的优秀视觉艺术家,现在都可以向 Microsoft 的合规 AI 要求制作更多横幅、展示图形和营销文案。
这家 Windows 巨头还推出了 Notebooks,一处可以存放各类文件的地方,Copilot 可按需对这些内容进行分析。
Friedman 解释道:“Copilot Notebooks 将我关于某个项目的所有文件整理到一起,并让我能与 Copilot 就该项目进行深入对话。”
第二波更新中的某些功能(如 Researcher 和 Analyst 代理)已立即向 Frontier Program 客户开放,预计更大范围的推广将于五月实现。
此项公告发布之际,IT 咨询公司 Gartner 预测来年将出现 AI 悖论:对生成式 AI 的不满与不断增加的支出并存。
Gartner Research 副总裁 John-David Lovelock 在一份声明中表示:“由于初步概念验证 (POC) 工作失败率高以及对现有生成式 AI 结果的不满,对生成式 AI 能力的期望正在下降。” “尽管如此,基础模型提供商每年仍投入数十亿美元来提升生成式 AI 模型的规模、性能和可靠性。这个悖论将持续到 2025 年和 2026 年。”
Gartner 预测,2025 年全球在生成式 AI 方面的支出将超过 6440 亿美元,较 2024 年增长逾 76%。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。