在OCP全球峰会首日,微软公布了一些关于现有数据中心项目的更新信息,以及其他微软参与的新项目。
OCP是一个致力于在企业之间共享数据中心产品设计和最佳实践的组织,让其他企业可以从他们的经验中受益,并以最低成本构建更高效的数据中心。微软于2014年以创始成员身份加入OCP,此外成员中还有很多其他知名企业,包括Facebook、IBM、英特尔、诺基亚、谷歌、戴尔和思科。
此前,OCP发布了各种数据中心硬件组件的规范,包括主板、电缆、芯片组、连接器和网络交换机。但是今年微软更专注于软件方面。
微软Azure杰出工程师Kushagra Vaid在博客中表示,今年微软最重要的捐赠之一是云压缩算法和针对云存储的优化硬件实现,也就是名为Project Zipline的项目,其相关源代码和硬件设计规范现在可以通过OCP获得。
微软还开放了Project Cerberus的代码和工具,此前微软将该项目称为加密微控制器的标准。Project Cerberus也是Project Olympus的下一阶段,后者是一项数据中心服务器设计,以前曾捐赠给OCP,搭配Azure Fv2虚拟机系列进行部署。
微软显然很乐观,认为这些设计将很快就会被其他人采用。微软方面表示,“期待受Project Cerberus启发的产品在2020年投入市场”。
微软今天宣布开源的其他项目还包括Datacenter-ready Secure Control Module,该模块为数据中心服务器主板提供了必要的元素,但不包括CPU、内存插槽和I/O插槽。微软表示,许多ODM厂商正在努力将DC-SCM/SCI基本规范与新服务器产品集成在一起。未来微软还计划将DC-SCM/SCI规范与去年捐赠给OCP的OCP Accelerator Module(OAM)结合起来。OAM规范涉及面向加速器的开放、可互操作的模块化基础设施,这些加速器用于人工智能和高性能计算工作负载。
此外微软还表示,正在研究如何将液体冷却技术扩展到其他领域,例如比特币采矿以及“更广泛的超大规模云技术”。微软称,正在与Facebook和CoolIT等OCP成员展开合作,为开发用于Project Olympus系统和Open Rack v3的盲板Cold-Plate解决方案创建新标准。Vaid解释说:“Cold-Plate解决方案已经在超级计算机中使用了多年,但是高度定制的,并非为满足云所需的可维护性和可靠性而设计。”
除此之外,微软还推出了一种新的机箱设计E.1S,针对运行在英特尔Cascade Lake和AMD Rome处理器上的系统进行了优化。Vaid说:“我们相信,这项新标准将通过降低容量增量、提高每GB IOPS、缓解成本限制,促进整个企业的广泛采用。”
好文章,需要你的鼓励
AI智能体必须能够在大型上下文和长期时间段内进行合作、协调和执行,Nvidia表示,这需要一种新型的基础设施,一种开放的基础设施。
这篇论文提出了CJE(因果法官评估)框架,解决了当前LLM评估中的三大致命问题:AI法官偏好倒置、置信区间失效和离线策略评估失败。通过AutoCal-R校准、SIMCal-W权重稳定和OUA不确定性推理,CJE仅用5%的专家标签就达到了99%的排名准确率,成本降低14倍,为AI评估提供了科学可靠的解决方案。
微软正式弃用Visual Studio Code编辑器的IntelliCode AI代码补全扩展,建议C#开发者改用GitHub Copilot Chat对话式AI助手。被弃用的扩展包括IntelliCode、IntelliCode Completions、IntelliCode for C# Dev Kit和IntelliCode API Usage Examples。微软建议开发者卸载相关扩展,继续使用Roslyn内置语言服务器支持或安装GitHub Copilot Chat。弃用后,开发者将不再看到代码补全列表中的星标提示和内联灰色文本建议,这些扩展也将立即停止bug修复和支持服务。
NVIDIA团队开发出Fast-FoundationStereo系统,成功解决了立体视觉AI在速度与精度之间的两难选择。通过分而治之的策略,该系统实现了超过10倍的速度提升同时保持高精度,包括知识蒸馏压缩特征提取、神经架构搜索优化成本过滤,以及结构化剪枝精简视差细化。此外,研究团队还构建了包含140万对真实图像的自动伪标注数据集,为立体视觉的实时应用开辟了新道路。