很快,就将出现仅供AI智能体申请的招聘网站。2025年将是AI全面入侵我们日常生活的一年,但这些AI员工到底出自谁手?为了找到答案,我们得先看看企业想要的是什么:触达用户、触达业务数据。也就是说,谁能更好地达成这两项目标,谁就会成为企业眼中最重要的AI智能体供应商。
我们平时使用的生产力工具大多来自哪里?微软、微软,还是微软。因此软件巨头在触达用户方面处于领先地位。无论是否情愿,大多数人已经在使用微软产品,而AI正在深度融入这些工具当中。毕竟Copilot如今可谓随处可见。
这样的市场覆盖率无疑是个巨大的优势。2023年和2024年,不少初创公司都推出了令人印象深刻的AI服务,但很快就被微软和谷歌等能够直接触达客户的巨头所覆盖。以Jasper.ai为例,这是一款曾经备受推崇、用于编写文本的AI工具。但我之前专门撰文讨论过,如今类似的功能被直接内置在谷歌和微软的产品当中,导致小型企业越来越难以参与竞争。
如果OpenAI不尽快建立自己的工具或者链条,恐怕也将面临同样的悲惨命运。而新款桌面应用可能就是这根链条。这款应用现在能够直接从各类以开发者为中心的工具(如VS Code、Xcode、TextEdit、Terminal以及iTerms2)中读取代码。也就是说,开发人员和作家们不再需要将自己的内容复制并粘贴到ChatGPT当中,这就省去了大家最懒于操作的一环。这款工具本身实用性极强,也代表着深入融合桌面用户工作流程的明智之举。至于能否借此削弱微软在生产力市场上的主导地位,恐怕只有时间能给出答案。
AI需要依赖数据才能发挥作用。假设大家正在寻求关于企业内部流程的答案或者文档中的见解,那么像OpenAI ChatGPT这样的通用工具显然无法满足需求。我们需要的是能够阅读并总结业务文档的工具,最好是专门根据企业用例而量身定制。正如前文所说,2025年将是搜索、特别是企业搜索全面起飞的元年。Transformer模型(包括OpenAI及其他厂商提供的模型)都具备这种能力,但前提是能够触达内部数据。
也就是说,谁能触达这些数据,谁就能在市场上占据主动。微软、亚马逊和谷歌自然是其中最具竞争力的代表,毕竟大量数据被存储在SharePoint之类的平台当中。但除此之外,Salesforce也掌握着大量有价值数据——涉及客户互动、讨论、流程文档、营销策略等等。Salesforce是否希望AI智能体帮助释放这部分潜力?答案当然是肯定的。但他们是否暂时处于劣势?也没错。
因此,Salesforce公司CEO Marc Benioff最近对微软发起抨击也就不足为奇了。他称微软的AI助手Copilot“令人失望”,并强调“它根本就不起作用,而且从任何角度来看也没有准确性可言。”他甚至将其称为“回形针2.0”——这可能是我最近听到过的最尖锐且有趣的侮辱——随后则介绍起Salesforce自家的AI解决方案Agent Forces。
OpenAI的数据触达或者用户覆盖水平肯定是不及微软,也不像Salesforce那样掌握一座商业数据宝库。那它的优势切入点在哪里?OpenAI声称拥有智能化程度最高的工具——也许真是如此,但我个人认为Anthropic的Claude 3.5目前要比OpenAI的GPT-4更强。
OpenAI的战略显然是凭借其卓越的技术抵消掉其他方面的劣势。当前的AI技术前沿是什么?答案是推理,本质上就是打造出“思维链更长”的模型。在这方面,OpenAI距离最终目标似乎要更近一些。
然而,“思维链更长”意味着CPU使用率更高、成本也将随之增长。OpenAI最近在E轮融资中筹集了66亿美元,这成为维持基运营所急需的推动力。相较于Salesforce的Agentforce从客户处取得的可观收入,以及微软掌握的规模庞大的资金储备,OpenAI仍处于说服企业和用户支付费用以抵消开发前沿AI的高昂成本这一早期发展阶段。
他们推出的每月200美元的高级套餐(包括o1模型的扩展版本)就是朝着这个方向迈出的重要一步。但服务本身真值得上这个价格吗?报道显示,一条精心设计的提示词(即由人类编写的指令)目前仍可以在实际成效上超越OpenAI的o1。
虽然这种情况将会改变,但可以肯定的是,OpenAI绝不是唯一一家能够提供高级推理能力的AI厂商。o1甚至没准很快就会被开源同类大模型所超越,毕竟之前Meta已经用数代Llama给了我们充足的信心。
说到Meta,我对2025年的发展还有一个预测,那就是他们将尝试推动AI模型的货币化。毕竟没有哪家私营企业能够在没有稳定可靠的收入来源的情况下,轻松证明巨额成本投入的合理性。
2025年,我们将看到更多AI智能体进入劳动力市场,通过简化、增强和自动化各类跨行业任务来颠覆原有工作流程。这些虽然还远称不上包罗万象的AGI通用人工智能模型,但却是一个个为特定工作流程所设计的小体量、专用型模型。AI将一步步扩展并改进工作流程,结合传统AI、上下文检索(RAG)乃至强大的用户设计逐渐克服安全性、幻觉和用户控制等固有挑战。
亚马逊、Salesforce、谷歌和微软都将努力成为这些AI智能体的底层技术支撑平台。而对于OpenAI和山姆·奥特曼本人来说,最核心的战略问题在于如何OpenAI最终需要与微软或者Salesforce开展直接竞争,那么该怎样为OpenAI的基础模型定价。毕竟如果不解决经济、或者说后勤问题,就不可能指望前线的攻城掠地、摧营拔寨。
好文章,需要你的鼓励
OpenAI CEO描绘了AI温和变革人类生活的愿景,但现实可能更复杂。AI发展将带来真正收益,但也会造成社会错位。随着AI系统日益影响知识获取和信念形成,共同认知基础面临分裂风险。个性化算法加剧信息茧房,民主对话变得困难。我们需要学会在认知群岛化的新地形中智慧生存,建立基于共同责任而非意识形态纯洁性的社区。
杜克大学等机构研究团队通过三种互补方法分析了大语言模型推理过程,发现存在"思维锚点"现象——某些关键句子对整个推理过程具有决定性影响。研究表明,计划生成和错误检查等高层次句子比具体计算步骤更重要,推理模型还进化出专门的注意力机制来跟踪这些关键节点。该发现为AI可解释性和安全性研究提供了新工具和视角。
传统数据中心基础设施虽然对企业至关重要,但也是预算和房地产的重大负担。模块化数据中心正成为强有力的替代方案,解决企业面临的运营、财务和环境复杂性问题。这种模块化方法在印度日益流行,有助于解决环境问题、满足人工智能的电力需求、降低成本并支持新一代分布式应用。相比传统建设需要数年时间,工厂预制的模块化数据中心基础设施可在数周内部署完成。
法国索邦大学团队开发出智能医学文献管理系统Biomed-Enriched,通过AI自动从PubMed数据库中识别和提取高质量临床案例及教育内容。该系统采用两步注释策略,先用大型AI模型评估40万段落质量,再训练小型模型处理全库1.33亿段落。实验显示该方法仅用三分之一训练数据即可达到传统方法效果,为医学AI发展提供了高效可持续的解决方案。