微软Azure和研究院团队正在合作开发一项新的AI基础设施服务,代号为“Singularity”。根据微软发布的部分招聘内容来看,Singularity团队正在努力构建微软所谓“全新的人工智能平台服务,将成为微软内部和外部人工智能的主要驱动力”。
该项目的成员发表了一篇题为“Singularity: Planet-Scale, Preemptible and Elastic Scheduling of AI Workloads”的论文,其中提供了关于Singularity项目的技术细节。Singularity服务旨在为数据科学家和AI从业者提供了一种方法,让他们可以在微软专为AI打造的分布式基础设施服务上构建、扩展、试验和迭代他们的模型。
这篇最近发布的发表论文,作者名单中包括Azure首席技术官Mark Russinovich;合作伙伴架构师Rimma Nehme,曾在Azure Cosmos DB工作,直到2019年转到Azure从事AI和深度学习方面的工作;以及技术研究员Dharma Shukla。根据这篇论文:
“Singularity的核心是一个新颖的、工作负载感知的调度程序,可以透明地提前抢占和弹性扩展深度学习工作负载,在不影响正确性或者性能水平的情况下,在全局加速器(例如GPU、FPGA)中提高利用率。”
微软方面此前曾讨论过将FPGA作为服务提供给客户的计划。2018年微软公开了代号“Project Brainwave”的项目,该项目旨在通过Azure提供快速AI处理能力。当时,微软预览了一个由Brainwave支持的Azure Machine Learning Hardware Accelerated Models,这也是微软在为客户提供用于AI工作负载的FPGA处理能力方面迈出的第一步。
我猜测,Singularity是微软把Brainwave转化为商业服务迈出的下一步,我已经向微软方面提出询问对此发表评论。我还询问过微软计划何时以及如何将Singularity转化为商业服务。
2019年,微软宣布在OpenAI上投资10亿美元,一年后微软宣布,已经与OpenAI合作并专门为OpenAI打造了全球第五大超级计算机。
虽然这款AI超级计算机是微软专为OpenAI打造的,但微软一直表示,将会通过Azure AI服务和GitHub提供微软大型AI模型和训练优化工具。此外微软还通过Azure AI为那些不需要专用超级计算机的客户提供各种加速器和服务。2021年11月,微软宣布将在Azure 中采用80GB NVIDIA A100 GPU扩展他们的AI超级计算机阵容。
大家可能还记得,此前微软曾把Singularity用作另一个研究项目的代号,当时这是一个微内核操作系统以及一组完全以托管代码开发的相关工具和库。这个Singularity并非基于Windows,而是作为概念验证从零开始编写的。Singularity最终催生以及/或者影响了微软其他几个操作系统研究项目,包括Barrelfish、Helios、Midori和Drawbridge。
另外值得注意的是,微软并不是唯一一家试图在自己内部和客户之间提供人工智能超级计算功能的科技公司。Meta也在做同样的事情,并且已经将其作为解锁元宇宙的一把钥匙。
好文章,需要你的鼓励
随着人工智能和高性能计算持续推动需求增长,数据中心设计正以同样惊人的速度演进。曾经的高密度机架已成为标准配置,冷却系统在数月而非数年内完成重新设计,项目在各地区的规模和复杂性不断提升。全球工程设计咨询公司Black & White Engineering指出,液冷成为标准配置、极端机架密度管理、工业化规模交付、电网约束下的电力创新、AI驱动运营设计以及可持续性成为核心设计原则,将成为2026年塑造数据中心设计、建设和运营的六大关键趋势。
Allen AI研究所联合多家顶尖机构推出SAGE智能视频分析系统,首次实现类人化的"任意时长推理"能力。该系统能根据问题复杂程度灵活调整分析策略,配备六种智能工具进行协同分析,在处理10分钟以上视频时准确率提升8.2%。研究团队创建了包含1744个真实娱乐视频问题的SAGE-Bench评估平台,并采用创新的AI生成训练数据方法,为视频AI技术的实际应用开辟了新路径。
Snowflake本周推送的一次更新导致全球范围内的"重大故障",用户长达13小时无法查询数据、文件导入失败并收到错误信息。初步调查显示,最新版本引入了不向后兼容的数据库架构更新,导致版本不匹配错误。此次故障影响了全球23个区域中的10个,包括美国、欧洲和亚洲多个数据中心。这是Snowflake一周内第二次发生事故。
中科院团队首次系统评估了AI视觉模型在文本压缩环境下的理解能力,发现虽然AI能准确识别压缩图像中的文字,但在理解深层含义、建立关联推理方面表现不佳。研究通过VTCBench测试系统揭示了AI存在"位置偏差"等问题,为视觉文本压缩技术的改进指明方向。