微软Azure和研究院团队正在合作开发一项新的AI基础设施服务,代号为“Singularity”。根据微软发布的部分招聘内容来看,Singularity团队正在努力构建微软所谓“全新的人工智能平台服务,将成为微软内部和外部人工智能的主要驱动力”。
该项目的成员发表了一篇题为“Singularity: Planet-Scale, Preemptible and Elastic Scheduling of AI Workloads”的论文,其中提供了关于Singularity项目的技术细节。Singularity服务旨在为数据科学家和AI从业者提供了一种方法,让他们可以在微软专为AI打造的分布式基础设施服务上构建、扩展、试验和迭代他们的模型。
这篇最近发布的发表论文,作者名单中包括Azure首席技术官Mark Russinovich;合作伙伴架构师Rimma Nehme,曾在Azure Cosmos DB工作,直到2019年转到Azure从事AI和深度学习方面的工作;以及技术研究员Dharma Shukla。根据这篇论文:
“Singularity的核心是一个新颖的、工作负载感知的调度程序,可以透明地提前抢占和弹性扩展深度学习工作负载,在不影响正确性或者性能水平的情况下,在全局加速器(例如GPU、FPGA)中提高利用率。”
微软方面此前曾讨论过将FPGA作为服务提供给客户的计划。2018年微软公开了代号“Project Brainwave”的项目,该项目旨在通过Azure提供快速AI处理能力。当时,微软预览了一个由Brainwave支持的Azure Machine Learning Hardware Accelerated Models,这也是微软在为客户提供用于AI工作负载的FPGA处理能力方面迈出的第一步。
我猜测,Singularity是微软把Brainwave转化为商业服务迈出的下一步,我已经向微软方面提出询问对此发表评论。我还询问过微软计划何时以及如何将Singularity转化为商业服务。
2019年,微软宣布在OpenAI上投资10亿美元,一年后微软宣布,已经与OpenAI合作并专门为OpenAI打造了全球第五大超级计算机。
虽然这款AI超级计算机是微软专为OpenAI打造的,但微软一直表示,将会通过Azure AI服务和GitHub提供微软大型AI模型和训练优化工具。此外微软还通过Azure AI为那些不需要专用超级计算机的客户提供各种加速器和服务。2021年11月,微软宣布将在Azure 中采用80GB NVIDIA A100 GPU扩展他们的AI超级计算机阵容。
大家可能还记得,此前微软曾把Singularity用作另一个研究项目的代号,当时这是一个微内核操作系统以及一组完全以托管代码开发的相关工具和库。这个Singularity并非基于Windows,而是作为概念验证从零开始编写的。Singularity最终催生以及/或者影响了微软其他几个操作系统研究项目,包括Barrelfish、Helios、Midori和Drawbridge。
另外值得注意的是,微软并不是唯一一家试图在自己内部和客户之间提供人工智能超级计算功能的科技公司。Meta也在做同样的事情,并且已经将其作为解锁元宇宙的一把钥匙。
好文章,需要你的鼓励
工业升级的关键,或许在于智能本身。“工业+机器人”将成为通向下一阶段工业体系的核心抓手。——黄仁勋。
浙江大学等联合研究发现,AI强化学习效果取决于"模型-任务对齐"程度。当AI擅长某任务时,单样本训练、错误奖励等非常规方法也有效;但面对陌生任务时,这些方法失效,只有标准训练有用。研究团队通过大量实验证实,这种"舒适圈"现象比数据污染更能解释训练差异,为AI训练策略优化提供了新思路。
瑞士政府正式发布了自主研发的人工智能模型,该模型完全基于公共数据进行训练。这一举措标志着瑞士在AI技术自主化方面迈出重要一步,旨在减少对外国AI技术的依赖,同时确保数据安全和隐私保护。该模型的推出体现了瑞士对发展本土AI能力的战略重视。
巴赫切希尔大学研究团队通过对五种不同规模YOLO模型的量化鲁棒性测试发现,静态INT8量化虽能带来1.5-3.3倍速度提升,但会显著降低模型对噪音等图像损伤的抵抗能力。他们提出的混合校准策略仅在大型模型处理噪音时有限改善,揭示了效率与鲁棒性平衡的复杂挑战。