ZD至顶网软件频道消息: 阿里云将最新的全浸没液冷服务器取名为“麒麟”,虽然这个名字实在不能算有创意,但是从服务器的表现看,确实对得起冠上神兽的名字。
“麒麟”神奇的地方在于它是泡在水里的,就像热得快需要浸没到水里加热,“麒麟”也是将服务器完全浸没到液体中,不过目的却是降温。4月26日,阿里云科学家在云栖大会·南京峰会上展示了全浸没的“凉得快”服务器——麒麟,把整台服务器浸在液体里循环冷却,这一方案可以无需使用空调,能源使用率(PUE)逼近了理论极限值1.0。
这是“麒麟”数据中心解决方案首次公开展示,这种耗能极低的技术方案将应用于阿里云服务,也将成为阿里巴巴的NASA计划的重要基础,可为未来20年提供计算能力。
利用热交换的原理,阿里巴巴工程师将服务器完全浸没在一种特殊的冷却液里,极速运算的服务器产生大量热量可被冷却液直接吸收进入外循环冷却,全程用于散热的能耗几乎为零。在传统数据中心里,几乎有一半的电能消耗在了散热上。
液体降温是一种极为高效的降温散热方式,但运用到商用服务器集群上还是头一次。阿里云科学家克服了服务器系统、制冷系统、冷却材料等多个领域的难题,实现了零噪音、零污染、绿色节能,可支持超过200kW功耗的服务器集群。
得益于浸没式液冷高效的散热效率,“麒麟”无需风扇、空调等大型制冷设备,可在任何地方部署,节省空间75%以上,单位体积内的计算能力比过去提升了10倍;高密封性也使得元器件远离湿度、灰尘、振动的影响,受干扰情况几乎为0;同时,这种特殊液体完全绝缘且无腐蚀性,即使浸没元器件20年以上,成分不会发生任何变化,也不会对电子元器件产生任何影响。
IDC预计,2020年将产生40ZB的数据。与此同时,到2024年数据中心耗电量将占到全社会耗电量的5%以上。传统风冷显得越来越力不从心,“麒麟”的出现打破了能耗对数据中心的制约,接近1.0的能源使用效率(PUE)可以让电力发挥出最大的计算能力。
作为阿里巴巴NASA计划的重要一环,阿里巴巴工程师致力于研发一条绿色高效的数据中心解决方案,陆续推出了年均PUE低于1.3的深层湖水制冷数据中心、PUE低于1.25的自然风冷数据中心,而今天,阿里巴巴“麒麟”的PUE正走向理论极限值1.0。
目前,“麒麟”已经通过了初步测试和验证,将通过阿里云对外提供计算服务。
好文章,需要你的鼓励
CoreWeave发布AI对象存储服务,采用本地对象传输加速器(LOTA)技术,可在全球范围内高速传输对象数据,无出口费用或请求交易分层费用。该技术通过智能代理在每个GPU节点上加速数据传输,提供高达每GPU 7 GBps的吞吐量,可扩展至数十万个GPU。服务采用三层自动定价模式,为客户的AI工作负载降低超过75%的存储成本。
清华大学、新加坡国立大学等顶尖高校联合发布重大AI研究成果,创新性地提出变分推理框架解决AI推理训练中的偏见问题。该方法将AI思考过程分解为思维轨迹和答案两部分,通过"思考教练"机制避免AI偏向简单问题的毛病。实验显示在数学、编程等多个领域均有显著提升,为构建更智能可靠的AI系统奠定基础。
谷歌DeepMind与核聚变初创公司CFS合作,运用先进AI模型帮助管理和改进即将发布的Sparc反应堆。DeepMind开发了名为Torax的专用软件来模拟等离子体,结合强化学习等AI技术寻找最佳核聚变控制方式。核聚变被视为清洁能源的圣杯,可提供几乎无限的零碳排放能源。谷歌已投资CFS并承诺购买其200兆瓦电力。
新加坡国立大学等机构研究团队提出反馈条件策略(FCP),让AI直接从文字反馈学习而非转换为数字评分。该方法在数学和通用推理任务上表现优异,能处理复杂混合反馈,支持灵活的行为控制,避免了传统强化学习中的奖励黑客问题,为AI训练开辟了新路径。