致力于开发人类级人工智能的旧金山实验室OpenAI公司,已经从微软那里获得了10亿美元用于支持人工智能开发的使命。
今天早上公布的这项投资也是两家厂商多年来技术合作伙伴关系的一个组成部分。2015年OpenAI项目启动时的初始资本也是10亿美元初。OpenAI获得过来自多位硅谷著名人物的捐赠,包括Elon Musk、LinkedIn联合创始人Reid Hoffman、前Y Combinator总裁Sam Altman,其中Altman今年早些时候辞职成为OpenAI的首席执行官。
OpenAI致力于开发所谓的人工通用智能,这是一种假设的高级人工智能形式,不仅能够掌握复杂的任务如国际象棋或者图像识别,还能够自己学习新的技能。OpenAI所做的工作完全是试水性质的:知名人工智能专家估计,把人类神经网络变为现实所需的时间可能长达几十年甚至是一个多世纪。
追求这样一个遥远的愿景需要大量资金的支持,这时候就需要微软了。今天宣布的这项投资将帮助OpenAI追赶上谷歌和Facebook等资金雄厚的企业,后两者正在开展他们自己尖端的人工智能研究计划。
作为合作伙伴关系的一部分,微软不仅将为OpenAI提供资金,还将成为OpenAI独家的云计算服务提供商,这将确保OpenAI可以获得大规模人工智能项目所需的大量基础设施。
两家公司没有具体说明这项投资的确切性质,但有人猜测其中大部分涉及到Azure服务,但OpenAI首席技术官Greg Brockman在Hacker News上表示,这是一项“现金投资”。 Altma曾向纽约时报表示,这项投资的大部分资金将转用于计算能力,而且合同要求微软最终成为OpenAI计算能力的唯一来源。
作为交换,OpenAI将支持微软的机器学习计划。OpenAI把微软作为自己AI研究成果商业化的“首选”合作伙伴。OpenAI将向微软授予一些技术许可,以及在Azure云平台上提供其他许可技术,以及与微软合作开展尚未指定的联合开发项目。
OpenAI为人工智能生态系统做出了重要贡献,最着名的成果之一是Gym——一种用于构建机器学习模型的流行工具包,以及Dactyl——一种利用人工智能来操纵物体的机器手,并且具有不可思议的灵巧性。
微软在致力于推动人工智能的发展。今年6月,微软开放了TensorWatch的源代码,TensorWatch用具用于简化调试机器学习模型的这一复杂任务。
在微软对OpenAI进行投资之前,OpenAI进行了一系列转型。OpenAI在创立之初是一个非营利组织,Altman今年3月上任之后不久开始采用新的运营模式,将大部分业务转移为一个名为OpenAI LP的营利性实体,以便更容易筹集资金来支持开发。
“通过将OpenAI的突破性技术与新的Azure AI超级计算技术结合在一起,我们致力于实现人工智能的民主化,同时始终将人工智能的安全性放在最重要的位置,这样每个人都可以从中受益,”微软公司首席执行官Satya Nadella声明中这样表示。
尽管微软将成为OpenAI的独家云提供商,但合作协议并没有提及微软是OpenAI唯一的投资者。OpenAI可能还会引入其他支持者,以分担人工智能研究的高昂成本。根据监管文件显示,谷歌DeepMind机器学习研究部门与OpenAI有类似的路线图,仅2017年就话费了4.4亿美元。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。