很快,就将出现仅供AI智能体申请的招聘网站。2025年将是AI全面入侵我们日常生活的一年,但这些AI员工到底出自谁手?为了找到答案,我们得先看看企业想要的是什么:触达用户、触达业务数据。也就是说,谁能更好地达成这两项目标,谁就会成为企业眼中最重要的AI智能体供应商。

我们平时使用的生产力工具大多来自哪里?微软、微软,还是微软。因此软件巨头在触达用户方面处于领先地位。无论是否情愿,大多数人已经在使用微软产品,而AI正在深度融入这些工具当中。毕竟Copilot如今可谓随处可见。
这样的市场覆盖率无疑是个巨大的优势。2023年和2024年,不少初创公司都推出了令人印象深刻的AI服务,但很快就被微软和谷歌等能够直接触达客户的巨头所覆盖。以Jasper.ai为例,这是一款曾经备受推崇、用于编写文本的AI工具。但我之前专门撰文讨论过,如今类似的功能被直接内置在谷歌和微软的产品当中,导致小型企业越来越难以参与竞争。
如果OpenAI不尽快建立自己的工具或者链条,恐怕也将面临同样的悲惨命运。而新款桌面应用可能就是这根链条。这款应用现在能够直接从各类以开发者为中心的工具(如VS Code、Xcode、TextEdit、Terminal以及iTerms2)中读取代码。也就是说,开发人员和作家们不再需要将自己的内容复制并粘贴到ChatGPT当中,这就省去了大家最懒于操作的一环。这款工具本身实用性极强,也代表着深入融合桌面用户工作流程的明智之举。至于能否借此削弱微软在生产力市场上的主导地位,恐怕只有时间能给出答案。
AI需要依赖数据才能发挥作用。假设大家正在寻求关于企业内部流程的答案或者文档中的见解,那么像OpenAI ChatGPT这样的通用工具显然无法满足需求。我们需要的是能够阅读并总结业务文档的工具,最好是专门根据企业用例而量身定制。正如前文所说,2025年将是搜索、特别是企业搜索全面起飞的元年。Transformer模型(包括OpenAI及其他厂商提供的模型)都具备这种能力,但前提是能够触达内部数据。
也就是说,谁能触达这些数据,谁就能在市场上占据主动。微软、亚马逊和谷歌自然是其中最具竞争力的代表,毕竟大量数据被存储在SharePoint之类的平台当中。但除此之外,Salesforce也掌握着大量有价值数据——涉及客户互动、讨论、流程文档、营销策略等等。Salesforce是否希望AI智能体帮助释放这部分潜力?答案当然是肯定的。但他们是否暂时处于劣势?也没错。
因此,Salesforce公司CEO Marc Benioff最近对微软发起抨击也就不足为奇了。他称微软的AI助手Copilot“令人失望”,并强调“它根本就不起作用,而且从任何角度来看也没有准确性可言。”他甚至将其称为“回形针2.0”——这可能是我最近听到过的最尖锐且有趣的侮辱——随后则介绍起Salesforce自家的AI解决方案Agent Forces。
OpenAI的数据触达或者用户覆盖水平肯定是不及微软,也不像Salesforce那样掌握一座商业数据宝库。那它的优势切入点在哪里?OpenAI声称拥有智能化程度最高的工具——也许真是如此,但我个人认为Anthropic的Claude 3.5目前要比OpenAI的GPT-4更强。
OpenAI的战略显然是凭借其卓越的技术抵消掉其他方面的劣势。当前的AI技术前沿是什么?答案是推理,本质上就是打造出“思维链更长”的模型。在这方面,OpenAI距离最终目标似乎要更近一些。
然而,“思维链更长”意味着CPU使用率更高、成本也将随之增长。OpenAI最近在E轮融资中筹集了66亿美元,这成为维持基运营所急需的推动力。相较于Salesforce的Agentforce从客户处取得的可观收入,以及微软掌握的规模庞大的资金储备,OpenAI仍处于说服企业和用户支付费用以抵消开发前沿AI的高昂成本这一早期发展阶段。
他们推出的每月200美元的高级套餐(包括o1模型的扩展版本)就是朝着这个方向迈出的重要一步。但服务本身真值得上这个价格吗?报道显示,一条精心设计的提示词(即由人类编写的指令)目前仍可以在实际成效上超越OpenAI的o1。
虽然这种情况将会改变,但可以肯定的是,OpenAI绝不是唯一一家能够提供高级推理能力的AI厂商。o1甚至没准很快就会被开源同类大模型所超越,毕竟之前Meta已经用数代Llama给了我们充足的信心。
说到Meta,我对2025年的发展还有一个预测,那就是他们将尝试推动AI模型的货币化。毕竟没有哪家私营企业能够在没有稳定可靠的收入来源的情况下,轻松证明巨额成本投入的合理性。
2025年,我们将看到更多AI智能体进入劳动力市场,通过简化、增强和自动化各类跨行业任务来颠覆原有工作流程。这些虽然还远称不上包罗万象的AGI通用人工智能模型,但却是一个个为特定工作流程所设计的小体量、专用型模型。AI将一步步扩展并改进工作流程,结合传统AI、上下文检索(RAG)乃至强大的用户设计逐渐克服安全性、幻觉和用户控制等固有挑战。
亚马逊、Salesforce、谷歌和微软都将努力成为这些AI智能体的底层技术支撑平台。而对于OpenAI和山姆·奥特曼本人来说,最核心的战略问题在于如何OpenAI最终需要与微软或者Salesforce开展直接竞争,那么该怎样为OpenAI的基础模型定价。毕竟如果不解决经济、或者说后勤问题,就不可能指望前线的攻城掠地、摧营拔寨。
好文章,需要你的鼓励
CPU架构讨论常聚焦于不同指令集的竞争,但实际上在单一系统中使用多种CPU架构已成常态。x86、Arm和RISC-V各有优劣,AI技术的兴起更推动了对性能功耗比的极致需求。当前x86仍主导PC和服务器市场,Arm凭借庞大生态系统在移动和嵌入式领域领先,RISC-V作为开源架构展现巨大潜力。未来芯片设计将更多采用异构计算,多种架构协同工作成为趋势。
KAIST AI团队通过深入分析视频生成AI的内部机制,发现了负责交互理解的关键层,并开发出MATRIX框架来专门优化这些层。该技术通过语义定位对齐和语义传播对齐两个组件,显著提升了AI对"谁对谁做了什么"的理解能力,在交互准确性上提升约30%,为AI视频生成的实用化应用奠定了重要基础。
Vast Data与云计算公司CoreWeave签署了价值11.7亿美元的多年期软件许可协议,这标志着AI基础设施存储市场的重要转折点。该协议涵盖Vast Data的通用存储层及高级数据平台服务,将帮助CoreWeave提供更全面的AI服务。业内专家认为,随着AI集群规模不断扩大,存储系统在AI基础设施中的占比可能从目前的1.9%提升至3-5%,未来五年全球AI存储市场规模将达到900亿至2000亿美元。
乔治亚理工学院和微软研究团队提出了NorMuon优化器,通过结合Muon的正交化技术与神经元级自适应学习率,在1.1B参数模型上实现了21.74%的训练效率提升。该方法同时保持了Muon的内存优势,相比Adam节省约50%内存使用量,并开发了高效的FSDP2分布式实现,为大规模AI模型训练提供了实用的优化方案。