微软和OpenAI之间的关系正在快速升温,近日,微软宣布将向OpenAI追加数十亿美元的投资,以支持OpenAI的研究,并将OpenAI的模型纳入微软的消费级和企业级产品中。
微软和OpenAI的合作关系最早可以追溯到2019年,现在已经走到了第三阶段,微软将把Azure云服务作为OpenAI工作负载的独家平台,这些负载包括GitHub Copilot自动编码工具、DALL-E 2图像生成器、以及跨研究、产品和API服务的ChatGPT自然语言模型。
一周前,微软刚刚宣布推出了支持OpenAI GPT-3大型语言模型托管版本的Azure服务。据报道,两家公司还就微软以100亿美元的价格收购OpenAI股份的事宜进行了谈判。而且有报道称,ChatGPT的技术将被整合到微软Bing搜索引擎中,此前尽管微软长达数年的投资,但Bing搜索引擎在全球搜索市场中仅占9%的份额。
微软公司首席执行官Satya Nadella在一份声明中表示:“双方合作伙伴关系迈入下一阶段,各行各业的开发人员和组织将能够使用Azure访问最好的AI基础设施、模型和工具链,以构建和运行他们的应用。”
Gartner杰出分析师、研究员Rajesh Kandaswamy表示,微软几乎没有提供有关如何把AI融入微软企业应用的具体细节,但不应低估重塑从Excel电子表格到LinkedIn方方面面的潜力。他说:“这是第一次AI让我们可以把概率推理应用到日常计算任务中。”
概率推理是指根据与事件相关的证据计算事件发生的概率,例如,可以推荐对电子邮件的适当回复,或者预估办公室工作人员每天应该处理的最重要的任务。
Kandaswamy说:“企业客户可能会从他们所使用的微软产品中受益,他们将更容易通过云获得更多基于AI的产品和服务,随着时间的推移,他们将使用越来越多微软产品中的AI功能。”
这笔交易也可能对Azure起到提振作用,Azure目前是全球第二大云基础设施平台,占有21%的市场份额,仅次于AWS的33%。Kandaswamy说:“我认为AI从根本上变革了计算,可能比云计算的威力更大。”不仅如此,微软和OpenAI联手,将有可能挑战谷歌作为最佳AI开发云平台的地位。
Forrester Research公司AI分析师Rowan Curran表示:“显然微软希望通过这种合作伙伴关系获得可观的商业回报,但他们可以获得更重要的短期回报。ChatGPT引发的热潮让ChatGPT几乎成为了AI的代名词,微软可以利用这一点,增加对Azure OpenAI API及更广泛AI/ML平台的需求。”
Kandaswamy,这次交易中OpenAI可以说是全面获胜了。他说:“OpenAI现在可以在广泛领域展示他们的创新,并将自己的技术交到企业手中,”到目前为止,这些企业还不是ChatGPT的大用户。“OpenAI还可以获得训练模型所需的强大计算能力”。
Curran表示认同:“与微软深化的合作关系,可以帮助OpenAI拥有更安全的财务状况,从而继续研究和取得进展。”
尽管具有先发优势,但没有理由相信OpenAI或者是微软会锁定大型语言模型市场。其他很多初创公司都在研究他们自己的技术,AWS和谷歌等巨头多年来一直在投资AI。
Wikibon首席分析师Dave Vellante认为,这个市场不太可能呈现出赢家通吃的局面,而且相比云计算来说,可能以更分散的方式发展。”
好文章,需要你的鼓励
在迪拜Gitex 2025大会上,阿联酋成为全球AI领导者的雄心备受关注。微软正帮助该地区组织从AI实验阶段转向实际应用,通过三重方法提供AI助手、协同AI代理和AI战略顾问。微软已在阿联酋大举投资数据中心,去年培训了10万名政府员工,计划到2027年培训100万学习者。阿联酋任命了全球首位AI部长,各部门都配备了首席AI官。微软与政府机构和企业合作,在公民服务和金融流程等领域实现AI的实际应用,构建全面的AI生态系统。
查尔斯大学和意大利布鲁诺·凯斯勒基金会的研究团队首次系统性解决了同声传译AI系统延迟评估的准确性问题。他们发现现有评估方法存在严重偏差,常给出相互矛盾的结果,并提出了YAAL新指标和SOFTSEGMENTER对齐工具。YAAL准确性达96%,比传统方法提升20多个百分点。研究还开发了专门的长音频评估工具LongYAAL,为AI翻译技术发展提供了可靠的测量标准。
苹果与俄亥俄州立大学研究人员发布名为FS-DFM的新模型,采用少步离散流匹配技术,仅需8轮快速优化即可生成完整长文本,效果媲美需要上千步骤的扩散模型。该模型通过三步训练法:处理不同优化预算、使用教师模型指导、调整迭代机制来实现突破。测试显示,参数量仅1.7亿至17亿的FS-DFM变体在困惑度和熵值指标上均优于70-80亿参数的大型扩散模型。
印度理工学院团队构建了史上最大规模印度文化AI测试基准DRISHTIKON,包含64288道多语言多模态题目,覆盖15种语言和36个地区。研究评估了13个主流AI模型的文化理解能力,发现即使最先进的AI也存在显著文化盲区,特别是在低资源语言和复杂推理任务上表现不佳,为构建文化感知AI提供了重要指导。