微软Azure和研究院团队正在合作开发一项新的AI基础设施服务,代号为“Singularity”。根据微软发布的部分招聘内容来看,Singularity团队正在努力构建微软所谓“全新的人工智能平台服务,将成为微软内部和外部人工智能的主要驱动力”。
该项目的成员发表了一篇题为“Singularity: Planet-Scale, Preemptible and Elastic Scheduling of AI Workloads”的论文,其中提供了关于Singularity项目的技术细节。Singularity服务旨在为数据科学家和AI从业者提供了一种方法,让他们可以在微软专为AI打造的分布式基础设施服务上构建、扩展、试验和迭代他们的模型。
这篇最近发布的发表论文,作者名单中包括Azure首席技术官Mark Russinovich;合作伙伴架构师Rimma Nehme,曾在Azure Cosmos DB工作,直到2019年转到Azure从事AI和深度学习方面的工作;以及技术研究员Dharma Shukla。根据这篇论文:
“Singularity的核心是一个新颖的、工作负载感知的调度程序,可以透明地提前抢占和弹性扩展深度学习工作负载,在不影响正确性或者性能水平的情况下,在全局加速器(例如GPU、FPGA)中提高利用率。”
微软方面此前曾讨论过将FPGA作为服务提供给客户的计划。2018年微软公开了代号“Project Brainwave”的项目,该项目旨在通过Azure提供快速AI处理能力。当时,微软预览了一个由Brainwave支持的Azure Machine Learning Hardware Accelerated Models,这也是微软在为客户提供用于AI工作负载的FPGA处理能力方面迈出的第一步。
我猜测,Singularity是微软把Brainwave转化为商业服务迈出的下一步,我已经向微软方面提出询问对此发表评论。我还询问过微软计划何时以及如何将Singularity转化为商业服务。
2019年,微软宣布在OpenAI上投资10亿美元,一年后微软宣布,已经与OpenAI合作并专门为OpenAI打造了全球第五大超级计算机。
虽然这款AI超级计算机是微软专为OpenAI打造的,但微软一直表示,将会通过Azure AI服务和GitHub提供微软大型AI模型和训练优化工具。此外微软还通过Azure AI为那些不需要专用超级计算机的客户提供各种加速器和服务。2021年11月,微软宣布将在Azure 中采用80GB NVIDIA A100 GPU扩展他们的AI超级计算机阵容。
大家可能还记得,此前微软曾把Singularity用作另一个研究项目的代号,当时这是一个微内核操作系统以及一组完全以托管代码开发的相关工具和库。这个Singularity并非基于Windows,而是作为概念验证从零开始编写的。Singularity最终催生以及/或者影响了微软其他几个操作系统研究项目,包括Barrelfish、Helios、Midori和Drawbridge。
另外值得注意的是,微软并不是唯一一家试图在自己内部和客户之间提供人工智能超级计算功能的科技公司。Meta也在做同样的事情,并且已经将其作为解锁元宇宙的一把钥匙。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。