Microsoft 365 Copilot迎来新团队成员,包括 Researcher 与 Analyst 代理。此次最新更新为 Microsoft 365 Copilot 引入了由 AI 驱动的搜索、所谓的推理代理以及全新的代理商店。部分用户已经能使用某些功能,而其他用户则可能需要等到五月才可体验。
其中一项新增功能是由 AI 驱动的企业搜索,这在过去曾因需要跨不同数据存储库应用策略以确保仅调用合适文件而令企业搜索供应商面临挑战。
“借助 Copilot 搜索,我们将搜索与 AI 的能力结合在一起,为您提供更相关、上下文感知的搜索结果,” Microsoft 设计与研究全球副总裁 Jon Friedman 在一段视频解说中表示。“它将您的工作数据与数十个应用连接起来,帮助您快速找到所需内容。而 Copilot 还可以对文件进行摘要,让您无需打开文档就能了解内容。”
对于担心让大语言模型在企业文件中乱翻的人来说,Microsoft 指出其 Copilot 控制系统,旨在让 IT 管理员和安全人员管理 Copilot 的交互和访问权限。
该系统包括 Purview 所支持的 AI 数据安全态势管理中的 Apps and Agents 部分,专门用于此类监管。此外,在 Microsoft Viva Insights 中还提供 Copilot 分析服务和 Copilot Studio 代理报告。
至于 AI 本身,Microsoft 365 Copilot 新增了两个角色: Researcher 和 Analyst。它们均为“推理代理”,即基于 OpenAI 的推理模型,尽管 Microsoft 尚未详细说明具体采用的是哪些模型。这里的“推理”指的是将任务分解为一步步并展示这些步骤执行过程的能力。
Researcher 代理旨在协助处理多步骤的研究任务,与 OpenAI 在二月份推出的深度研究代理类似。微软在演示视频中展示了使用以下提示让该代理制定市场营销计划的过程:
Create a marketing plan for the upcoming smart sneaker launch. Emphasize its ergonomic design, health tracking, and GPS integration. Make sure to include recommendations on the right digital channels and content strategy. Include insights from [the] competitive landscape and our past campaigns.
请为即将发布的智能运动鞋推出制定市场营销计划。重点突出其人体工程学设计、健康追踪和 GPS 集成。务必包含关于合适数字渠道和内容策略的推荐,并结合竞争态势和我们过往营销活动的洞察。
设想一下,你是一位雄心勃勃但不甚聪明的实习生,而你的顶尖营销团队因为跟随了推荐引擎建议体验一家流行的新潮贝类快闪店而集体食物中毒。此时,你会非常希望有像 Researcher 这样的代理为你草拟一份勉强过得去的营销计划,好让你能因此得到认可。
Analyst 代理在数据分析方面同样承诺实现类似的信息处理能力。
“一位未透露姓名的 Microsoft 员工在视频中解释道:‘Analyst 建立在 OpenAI 的 o3-mini 推理模型之上,并针对企业环境中的高级数据分析进行了优化,包括在何时以及如何使用 Python。’” “因此,即使你从未编写过一行代码,也可以获得只有 Python 才能提供的丰富数据洞察。”
或许你看不懂代码,但 Microsoft 的 AI 可以为你解释。显然,这是一个进步。
这些新代理现已在全新亮相的代理商店中上线,该店还展示了来自包括 Jira、Monday.com 和 Miro 等多家合作伙伴的产品。此外,还提供定制构建的代理,允许企业选择自动化执行特定任务或为 Copilot 提供对特定数据的访问权限。
各大模型提供商每年投入数十亿美元,以提升生成式 AI 模型的规模、性能和可靠性。这个悖论将持续到 2025 年和 2026 年。
在创作体验方面,Copilot 增添了 OpenAI GPT-4o 的图像生成功能,使其更加强大。无论是准设计专业人士,还是那些不愿意将其才华付诸实践的优秀视觉艺术家,现在都可以向 Microsoft 的合规 AI 要求制作更多横幅、展示图形和营销文案。
这家 Windows 巨头还推出了 Notebooks,一处可以存放各类文件的地方,Copilot 可按需对这些内容进行分析。
Friedman 解释道:“Copilot Notebooks 将我关于某个项目的所有文件整理到一起,并让我能与 Copilot 就该项目进行深入对话。”
第二波更新中的某些功能(如 Researcher 和 Analyst 代理)已立即向 Frontier Program 客户开放,预计更大范围的推广将于五月实现。
此项公告发布之际,IT 咨询公司 Gartner 预测来年将出现 AI 悖论:对生成式 AI 的不满与不断增加的支出并存。
Gartner Research 副总裁 John-David Lovelock 在一份声明中表示:“由于初步概念验证 (POC) 工作失败率高以及对现有生成式 AI 结果的不满,对生成式 AI 能力的期望正在下降。” “尽管如此,基础模型提供商每年仍投入数十亿美元来提升生成式 AI 模型的规模、性能和可靠性。这个悖论将持续到 2025 年和 2026 年。”
Gartner 预测,2025 年全球在生成式 AI 方面的支出将超过 6440 亿美元,较 2024 年增长逾 76%。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。