微软Azure和研究院团队正在合作开发一项新的AI基础设施服务,代号为“Singularity”。根据微软发布的部分招聘内容来看,Singularity团队正在努力构建微软所谓“全新的人工智能平台服务,将成为微软内部和外部人工智能的主要驱动力”。
该项目的成员发表了一篇题为“Singularity: Planet-Scale, Preemptible and Elastic Scheduling of AI Workloads”的论文,其中提供了关于Singularity项目的技术细节。Singularity服务旨在为数据科学家和AI从业者提供了一种方法,让他们可以在微软专为AI打造的分布式基础设施服务上构建、扩展、试验和迭代他们的模型。
这篇最近发布的发表论文,作者名单中包括Azure首席技术官Mark Russinovich;合作伙伴架构师Rimma Nehme,曾在Azure Cosmos DB工作,直到2019年转到Azure从事AI和深度学习方面的工作;以及技术研究员Dharma Shukla。根据这篇论文:
“Singularity的核心是一个新颖的、工作负载感知的调度程序,可以透明地提前抢占和弹性扩展深度学习工作负载,在不影响正确性或者性能水平的情况下,在全局加速器(例如GPU、FPGA)中提高利用率。”
微软方面此前曾讨论过将FPGA作为服务提供给客户的计划。2018年微软公开了代号“Project Brainwave”的项目,该项目旨在通过Azure提供快速AI处理能力。当时,微软预览了一个由Brainwave支持的Azure Machine Learning Hardware Accelerated Models,这也是微软在为客户提供用于AI工作负载的FPGA处理能力方面迈出的第一步。
我猜测,Singularity是微软把Brainwave转化为商业服务迈出的下一步,我已经向微软方面提出询问对此发表评论。我还询问过微软计划何时以及如何将Singularity转化为商业服务。
2019年,微软宣布在OpenAI上投资10亿美元,一年后微软宣布,已经与OpenAI合作并专门为OpenAI打造了全球第五大超级计算机。
虽然这款AI超级计算机是微软专为OpenAI打造的,但微软一直表示,将会通过Azure AI服务和GitHub提供微软大型AI模型和训练优化工具。此外微软还通过Azure AI为那些不需要专用超级计算机的客户提供各种加速器和服务。2021年11月,微软宣布将在Azure 中采用80GB NVIDIA A100 GPU扩展他们的AI超级计算机阵容。
大家可能还记得,此前微软曾把Singularity用作另一个研究项目的代号,当时这是一个微内核操作系统以及一组完全以托管代码开发的相关工具和库。这个Singularity并非基于Windows,而是作为概念验证从零开始编写的。Singularity最终催生以及/或者影响了微软其他几个操作系统研究项目,包括Barrelfish、Helios、Midori和Drawbridge。
另外值得注意的是,微软并不是唯一一家试图在自己内部和客户之间提供人工智能超级计算功能的科技公司。Meta也在做同样的事情,并且已经将其作为解锁元宇宙的一把钥匙。
好文章,需要你的鼓励
RiOSWorld是一项开创性研究,评估多模态计算机使用代理在真实环境中的安全风险。由上海人工智能实验室团队开发的这个基准测试包含492个风险任务,涵盖网页浏览、社交媒体、操作系统等多种应用场景。研究将风险分为环境源和用户源两大类,通过风险目标意图和完成两个维度进行评估。对十个代表性MLLM代理的测试结果表明,当前代理在风险目标意图上的不安全率高达84.93%,在风险目标完成上达59.64%,揭示了AI代理在计算机使用安全性方面存在的严重隐患,为未来可信AI系统的开发提供了重要参考。
牛津大学林元泽及其国际合作团队开发的IllumiCraft是一种创新的视频重光照技术,它首次将几何和光照引导统一到一个扩散模型中。通过同时处理HDR环境图、合成重光照帧和3D点轨迹,该技术能生成与用户提示一致的时间连贯视频。研究团队还构建了包含20,170个视频对的高质量数据集,实验表明IllumiCraft在视觉质量、提示对齐和时间一致性方面显著优于现有方法,开创了可控视频生成的新可能。
中国人民大学物理学院研究团队开发了HTSC-2025,这是一个专为AI预测超导临界温度而设计的常压高温超导体基准数据集。该数据集包含140个样本,涵盖了2023-2025年基于BCS理论预测的超导材料,平均Tc为27.3K,最高达160K。研究不仅提供了公开的评估框架,还总结了提高超导温度的物理策略,如空穴掺杂和轻元素引入。该基准已在GitHub开源,为AI驱动的超导材料发现提供了重要支持。
MBZUAI研究团队开发了FinChain,这是金融领域首个可验证的符号化思维链推理基准测试。该基准涵盖12个金融领域的54个主题,每个主题包含5个不同难度的参数化模板,配有可执行的Python代码验证每一步推理。研究者还提出了ChainEval评估指标,同时评估最终答案正确性和中间推理步骤一致性。对30个大语言模型的测试表明,即使最先进模型在处理复杂金融推理时仍有很大提升空间,且模型规模是决定推理能力的关键因素。