Cohere Inc. 今日推出了 North,这是一款旨在让企业员工更便捷地使用其人工智能模型的新产品。
公司将这款产品描述为"安全的 AI 工作平台",目前通过早期访问计划提供服务。
总部位于多伦多的 Cohere 开发了一系列名为 Command 的大语言模型。与 OpenAI 不同,该公司并不提供面向消费者的聊天机器人服务,而是专注于企业市场。在去年 7 月完成 5 亿美元融资后,Cohere 的估值达到了 55 亿美元。
作为公司的新产品,North 提供了一个聊天机器人界面,让客户能够与其 Command 大语言模型系列进行交互。员工可以使用该工具分析财务报告、查找文档以及执行其他商务任务。North 不仅可以在回应中包含文本,还能包含图表等其他数据。
用户可以通过创建 AI 代理来定制 North,这些 AI 程序针对特定任务进行了优化。例如,人力资源专员可以构建一个代理来自动化部分新员工入职工作。Cohere 表示,创建 AI 代理只需要点击几下,无需编程专业知识。
在内部评估中,公司将 North 与 Microsoft Copilot 和 Google Vertex AI Agent Builder 在金融、人力资源、客户支持和 IT 任务方面进行了对比。Cohere 表示其产品在所有四个类别中都优于竞争对手。测试使用了名为 Llama Index 的基准,只要 AI 生成的答案"至少相关且正确"即可接受。
在技术层面,North 不仅由 Command 驱动,还搭载了 Cohere 的 Compass 产品。后者是一个 AI 驱动的搜索工具,可以在公司系统中查找特定数据片段,并使其可供 AI 模型使用。它不仅可以从文档中提取数据,还能处理幻灯片、图片和电子表格等多模态文件。
Compass 基于两个 AI 模型。第一个是 Embed,它将数据转换为嵌入向量,这种数学表示方式使 AI 模型比处理原始商业文档更容易处理。另一个模型是 Rerank,它分析用户查询返回的信息,并对最相关的项目进行优先排序。
据 Cohere 介绍,North 可以在云端和本地部署。它能够在气隙环境中运行,即出于网络安全考虑与公司其他网络和互联网隔离的环境。这可能使高度监管行业的组织更容易采用 North。
Cohere 创始人兼首席执行官 Aidan Gomez 在博客文章中写道:"当前的自建式 AI 部署方式给组织带来了巨大负担,需要投入时间、专业知识和资源来开发定制解决方案并维护它们。North 帮助避免这些痛点,缩短了客户的价值实现时间。"
Cohere 表示,加拿大皇家银行是使用 North 的早期客户之一。据该大语言模型提供商称,他们将与该银行合作开发针对金融行业优化的软件版本。这表明 Cohere 未来可能会推出更多针对特定行业的版本。
North 的推出大约发生在 OpenAI 推出 canvas 两个月之后,后者是 ChatGPT 的一个面向生产力的界面。该功能主要针对写作和编程任务,包含一个大型界面面板,用于显示用户的代码或文本,以及 AI 生成的编辑建议。
图片来源:Cohere
好文章,需要你的鼓励
地球日之际,NVIDIA聚焦五个推动气候科学与可持续发展的项目:利用Earth-2平台开展气候模拟、借助AI推进红毛猩猩等濒危物种保护研究、通过AMP机器人实现可回收物自动分拣、借助AI技术研究早期海啸预警系统,以及通过Planet地球观测数据平台提取环境洞察。AI与加速计算正大幅提升环境保护与气候研究的效率与精度。
这项来自哥本哈根大学等多机构的研究(arXiv:2604.09746),构建了一个纽约市虚拟导航模拟系统,让150个"蓝队"AI与100个隐藏身份的"红队"AI交互对抗。红队通过伪装成热心路人,用风景渲染、权威话术等手段把蓝队引向广告牌陷阱。研究采用KTO方法进行十轮迭代训练,发现蓝队任务完成率从46%升至57.3%,逐渐习得了主动反驳、目标锚定等策略,但被骗率始终高达70%以上,揭示了AI智能体在持续社交操控下的深层脆弱性。
CoreWeave宣布推出三项新功能,旨在简化跨云AI训练与推理工作。其中CoreWeave Interconnect直接与谷歌云互联,支持开发者灵活部署训练和推理任务;SUNK Anywhere支持大规模长周期AI训练项目,可跨谷歌云、AWS、Azure及本地环境扩展算力;LOTA Cross-Cloud则允许数据集中存储、跨云运行工作负载。此次合作借助谷歌全球网络扩展了CoreWeave的服务覆盖范围,并消除了企业连接多云时依赖第三方的繁琐流程。
本文介绍了由南方科技大学等机构于2026年4月发表的研究(arXiv:2604.08865),提出了名为SPPO的大模型推理训练新方法。该方法将推理任务重新建模为"序列级情境赌博机",用一个轻量级价值模型预测题目难度,以单次采样替代GRPO的多次采样,解决了标准PPO的"尾部效应"问题。实验显示,SPPO在数学基准测试上超越GRPO,训练速度提升约5.9倍,配合小尺寸价值模型还能显著降低显存占用。