微软透露,正在尝试一种所谓的“两相浸入式冷却技术”,使用一种在极低温度下沸腾的液体来保持数据中心的冷却。
微软今天在Innovation博客上发表的一篇帖子中这样解释说,已经在位于美国华盛顿州昆西的Azure数据中心采用了这种技术。
目前,微软主要是依靠空气冷却系统让数据中心内运行的处理器的温度保持在可控范围内。但微软表示,基于液体的冷却系统能耗更低,因此具有更大的潜力,液体中传热“比空气中传热效率高几个数量级”,这就意味着液冷系统要更加环保。
据悉,这种两相浸入式冷却技术比谷歌在其数据中心内采用的单相冷却技术更为有效。微软称,单相冷却是让流体保持液态,通过自然对流或者强制对流带走热量。因此,单相浸入式冷却和空气冷却的方式类似,热流体在循环回系统之前会先通过一个热交换器。
微软表示,自己的两相浸入式冷却是一种更被动的方式。当系统中使用的流体与数据中心内部的发热组件接触时,会从液体变为自然上升的蒸汽,将热量作为一种潜能运走。蒸汽通过冷凝器排出热量,然后转化回液态,循环到系统中。
为此,微软开发了一套工程解决方案,使得服务器系统沉浸其中的时候不会对其造成损坏。流体是位于钢制冷却罐中,沸点仅为122华氏度,比水的沸点低约90度。同时,连接管穿过箱体、将蒸汽冷凝的液体导流到一个单独的闭环系统,流体将热量从水箱传递到位于外部的干式冷却器。
目前,微软仅部署了一个罐体,计划做一系列测试检查这一新冷却系统的实用性。
微软表示,到目前为止测试表明,这种两相浸入式冷却系统可以将任何服务器的功耗降低5%至15%。服务器甚至可以超频、或者以更高功率运行,没有任何过热的风险。
微软杰出工程师Christian Belady表示:“超级计算使用这种冷却技术有数十年时间了,因此风险不会那么高。我们的目标是将其部署到所有数据中心,但是在此之前还有很多工作要做。”
Beladay指出,除了更有效地传热之外,这种技术还有其他好处。因为系统去除了环境中的湿气和氧气,所以大大降低了腐蚀性,从而减少了系统中的机械故障。微软最早通过Project Natick(实验性海底数据中心项目)发现了这一点。
他说:“浸入式技术也有类似的好处,基本上你是在置换氧气和水分。”
微软还将继续其他液冷技术的试验,其中包括使用填充有液态制冷剂管道的所谓“冷板”。 Belady表示,两种技术都有潜力,两相浸入式技术令他感到非常兴奋是因为这只需要一次性成本,只需要实施一次,而在服务器迭代时无需进行任何工程设计。
“如果采取措施得当,两相浸入式冷却系统将同时满足我们所有成本、可靠性和性能方面的要求,能源消耗几乎是空气冷却的一个零头,”微软Azure首席软件工程师Ioannis Manousakis这样说道。
好文章,需要你的鼓励
这篇研究论文介绍了"Speechless",一种创新方法,可以在不使用实际语音数据的情况下训练语音指令模型,特别适用于越南语等低资源语言。研究团队通过将文本指令转换为语义表示,绕过了对高质量文本转语音(TTS)系统的依赖。该方法分三个阶段:首先训练量化器将语音转为语义标记;然后训练Speechless模型将文本转为这些标记;最后用生成的合成数据微调大型语言模型。实验表明,该方法在越南语ASR任务中表现出色,为低资源语言的语音助手开发提供了经济高效的解决方案。
《Transformer Copilot》论文提出了一种革命性的大语言模型微调框架,通过系统记录和利用模型训练过程中的"错误日志"来提升推理性能。研究团队受人类学习者记录和反思错误的启发,设计了一个"副驾驶"模型来辅助原始"驾驶员"模型,通过学习错误模式并在推理时校正输出。这一方法在12个基准测试上使模型性能提升高达34.5%,同时保持计算开销最小,展现了强大的可扩展性和可迁移性,为大语言模型的优化提供了全新思路。
德克萨斯大学Austin分校的研究团队提出了RIPT-VLA,一种创新的视觉-语言-动作模型后训练范式。该方法通过让AI模型与环境互动并仅接收简单的成功/失败反馈来学习,无需复杂的奖励函数或价值模型。实验证明,RIPT-VLA能显著提升现有模型性能,在轻量级QueST模型上平均提升21.2%,将大型OpenVLA-OFT模型推至97.5%的前所未有成功率。最令人惊叹的是,仅用一个示范样本,它就能将几乎不可用的模型在15次迭代内从4%提升至97%的成功率,展现出卓越的数据效率和适应能力。
北京大学与华为诺亚方舟实验室研究团队共同开发了TIME基准,这是首个专为评估大语言模型在真实世界场景中的时间推理能力而设计的多层级基准。该研究提出了三个层级的时间推理框架,包含11个细粒度任务,并构建了涵盖38,522个问答对的数据集,针对知识密集型信息、快速变化的事件动态和社交互动中的复杂时间依赖性三大现实挑战。实验结果表明,即使是先进模型在构建时间线和理解复杂时间关系方面仍面临显著挑战,而测试时扩展技术可明显提升时间逻辑推理能力。