微软Azure超级计算机“Voyager-EUS2”成功打入全球最快计算机十强。
微软Voyager-EUS2超级计算机的基准速度为每秒30Petaflops(Petaflops:每秒一千万亿[1015]次浮点运算),但仍然远远不如中国的天河2A和美国能源部基于IBM的Summit超级计算机,但微软Azure是唯一拥有进入高性能计算(HPC)500强前10名超级计算机的主要云提供商。
Voyager-EUS2是全球最快超级计算机500强里前10里唯一第一次入围的计算机,日本的Fugaku以763万个内核和442 Pflop s的Linpack基准得分在500强榜单中拔得头筹。
Flops 指每秒钟的浮点运算,用于表达超级计算机的性能,超级计算机通常用于科学领域,例如模拟天气模式,通常用Fortran等编程语言。
Fugaku的基准得分比美国能源部赞助的Summit超级计算机快三倍,Summit超级计算机是美国最快的高性能计算机,Linpack得分为148.8 Pflop s。Summit基于IBM的Power9 CPU,拥有4356个节点,每个节点有22个内核,内置6个Nvidia Tesla V100 GPU。
排第四位是加州大学劳伦斯-利弗莫尔国家实验室的超级计算机Sierra。Sierra也是由Power9 CPU和Nvidia Tesla V100 GPU驱动,得分94.6 Pflop/s。
微软的Azure超级计算机虽然排名第十,但却是全球最快超级计算机佼佼者榜单里的表现突出,因为Voyager-EUS2是前十名名单中唯一第一次入围的计算机,微软Azure也是唯一拿到这么好排名的公共云供应商。
微软的Voyager-EUS2在旗下的Azure美东2区域里运行。值得一提的是,首先, Voyager-EUS2运行Linux发行版Ubuntu 18.04长期服务(LTS)版,不是那么令人惊讶。另外,Voyager-EUS2的 AMD EPYC CPU拥有253440个内核。
微软Azure云中的大部分虚拟机都运行Linux,所以Azure超级计算机运行Ubuntu并不令人惊讶。另外,世界上所有最大型的超级计算机都运行Linux发行版。
微软的Azure系统的Voyager-EUS2是十强里唯一新入围的系统。Voyager-EUS2得分为30.05 Pflop/s,排第10位。其架构是基于拥有48个内核和2.45GHz的AMD EPYC处理器,内置80GB内存的NVIDIA A100 GPU,数据传输用的是Mellanox HDR Infiniband。
微软本周曾表示,旗下的Azure云现在有五台超级计算机进入500强名单。微软正在将超级计算机用于人工智能并将旗下的Azure 高性能计算作为一项服务出售。
微软还宣布面向一般用户推出名为“NDm A100 v4系列”的Azure虚拟机,NDm A100 v4系列虚拟机配备Nvidia A100 Tensor Core 80GB GPU,A100 80GB GPU的内存是原Nvidia A100 Tensor Core GPU内存的两倍。
好文章,需要你的鼓励
这篇研究提出了OThink-R1,一种创新的大型推理模型,能够像人类一样在快速直觉思维和慢速深度推理之间自动切换。研究者发现,现有推理模型即使面对简单问题也会生成冗长的推理过程,导致计算资源浪费。通过分析推理轨迹并使用LLM评判员区分冗余和必要推理,OThink-R1能根据问题复杂度动态调整思考深度。实验表明,该方法平均减少了23.4%的生成文本量,同时保持或提高了准确率,代表了向更高效、更人性化AI推理系统迈出的重要一步。
这项研究提出了SHARE,一种新型文本到SQL修正框架,它利用三个小型语言模型(SLM)协同工作,实现高效精准的SQL错误修正。SHARE首先通过基础行动模型将SQL转换为行动轨迹,再经过模式增强模型和逻辑优化模型的层次化精细化修正。研究团队还创新性地提出了层次化自演化训练策略,大大提高了训练数据效率。实验结果表明,SHARE在多个基准测试上显著提升了SQL生成准确率,计算成本仅为传统方法的十分之一,并展现出强大的泛化能力,适用于各种生成器模型和SQL方言。
这项由香港大学和南京大学等机构研究人员联合开发的双专家一致性模型(DCM)解决了高质量视频生成中的效率难题。研究团队发现扩散模型蒸馏过程中存在优化冲突:早期阶段负责语义布局与运动,后期阶段关注细节精修,两者学习动态差异显著。DCM创新性地将这两个任务分配给不同的专家模型,通过参数高效的实现方式,使模型仅需4步即可生成接近50步原始模型质量的视频,大幅提升生成速度,为实用化AI视频创作铺平道路。
这项研究介绍了QARI-OCR,一种基于Qwen2-VL-2B-Instruct模型微调的阿拉伯文字识别系统。研究团队通过三阶段合成数据训练,成功解决了阿拉伯文字识别中的主要挑战:曲线连笔特性、上下文变化的字母形状和发音符号。QARI v0.2模型创下了0.061的字符错误率和0.160的单词错误率,超越了现有开源解决方案,为阿拉伯文化遗产的数字化保存提供了重要工具。