Google Cloud近日详细介绍了Axion,一款基于Arm核心设计的、内部开发的CPU。
Google Cloud首席执行官Thomas Kurian在美国拉斯维加斯举行的Cloud Next大会发表主题演讲时推出了这款CPU。在这次活动上,Google Cloud还宣布最新的AI加速器TPU v5p全面上市,这款芯片在处理浮点数(AI模型常用的数据单元)时性能是前身的2倍。
Google Cloud机器学习、系统和云AI副总裁Amin Vahdat在一篇博客文章中表示:“阿姆达尔定律表明,随着加速器的不断改进,通用计算将主导成本并限制我们的基础设施能力,除非我们做出相应的投资来跟上步伐。”
基于Arm的架构
Google Cloud尚未分享Axion架构的详细信息,例如它包含多少个核心以及板载缓存的数量。Google Cloud表示,有关该芯片设计的更多信息将于今年晚些时候公布,不过确实透露称,Axion是基于Arm Neoverse V2 CPU核心设计的。
Neoverse V2是在2022年推出的,针对云数据中心和其他高性能计算环境进行了优化,速度是Arm上一代核心设计的2倍。据该芯片制造商称,这种加速的一部分原因是进行了优化,使得Neoverse V2能够更快地处理整数——许多类型计算中使用的常见数据单位。
基于Neoverse V2的处理器可以配备多达256个核心和512MB缓存,还可以使用Arm最新的指令集架构ARMv9。芯片的指令集架构包括用于表达计算的机器语言和某些相关技术。
Neoverse V2支持的ARMv9功能之一,是一种称为Memory Tagging Extension的网络安全机制。据Arm称,它把连接到芯片的内存分成16位段,并向每个段添加四个附加位,充当一种锁。只有有权访问内存段的应用才能通过锁定,从而降低了黑客攻击的风险。
Neoverse还支持ARMv9的PDP(性能定义功率)功能,此功能可以通过降低CPU的最大性能来提高CPU的能效。
定制云芯片
Google Cloud在自己的数据中心内出了部署Axion处理器之外,还会部署一套名为Titanium的基础设施优化系统,它将卸载Axion处理器的一些任务,为客户工作负载留下更多计算能力。据Google Cloud称,Titanium是由三套内部开发的芯片组成的。
Titanium系统使用了名为Titan的微控制器或简单处理器作为Axion的信任根。信任根是一个硬件模块,可以防止黑客在服务器启动时将恶意代码引入服务器。据 Google Cloud称,Titan还有助于保护数据中心的网络流量。
Axion将把处理用户网络流量所涉及的一些计算转给名为TOP的定制芯片,该芯片也是Titanium系统的一部分。与此同时,第三个名为Titanium适配器的定制处理器也可以帮助运行为Google Cloud实例提供支持的虚拟化软件。Hyperdisk是Google Cloud的块存储服务,承担了一些原本由Axion执行的计算任务,以进一步提高性能。
“Axion处理器为Web和应用服务器、容器化微服务、开源数据库、内存缓存、数据分析引擎、媒体处理、基于CPU的AI训练和推理等通用工作负载带来了巨大的性能飞跃,”Vahdat详细说道。
Google Cloud表示,与竞争对手最快的Arm通用实例相比,基于Axion的实例的性能提高了30%。此外Google Cloud还承诺,与基于英特尔芯片的实例相比,处理速度提高了50%,能效提高60%。Google Cloud计划在今年晚些时候向客户提供Axion。
Google Cloud还将使用该芯片为多个内部工作负载提供支持。Google已经开始重组其数据中心,在基于Arm的硬件上运行某些Google Cloud服务、YouTube广告系统和Google Earth Engine卫星图像分析平台,并计划在不久的将来在Axion支持的服务器上部署其中一些工作负载。
好文章,需要你的鼓励
ServiceNow宣布将以超过10亿美元收购身份安全平台Veza,这是该公司2025年一系列AI和数据重点收购的最新举措。此次收购正值企业加速部署AI代理之际,而如何管理这些非人类身份的访问权限和输出已成为普遍难题。该交易将为ServiceNow的AI控制塔提供关键的身份治理能力,帮助企业建立统一的控制平面来定义上下文相关的权限、监控代理行为并大规模执行最小权限访问策略。
字节跳动等机构联合发布GAR技术,让AI能同时理解图像的全局和局部信息,实现对多个区域间复杂关系的准确分析。该技术通过RoI对齐特征重放方法,在保持全局视野的同时提取精确细节,在多项测试中表现出色,甚至在某些指标上超越了体积更大的模型,为AI视觉理解能力带来重要突破。
在生成式AI热潮中,只有英伟达和台积电真正赚到钱,其他AI产业链公司要么亏损要么利润被稀释。博通虽然在数据中心网络领域有不错的利润率,但为了不被AI浪潮抛弃,也选择进入AI业务。博通拥有730亿美元的AI积压订单,但被迫成为AI系统集成商,进一步稀释利润。第四季度博通收入180亿美元,同比增长28.2%,AI芯片收入达65亿美元。
Inclusion AI团队推出首个开源万亿参数思维模型Ring-1T,通过IcePop、C3PO++和ASystem三项核心技术突破,解决了超大规模强化学习训练的稳定性和效率难题。该模型在AIME-2025获得93.4分,IMO-2025达到银牌水平,CodeForces获得2088分,展现出卓越的数学推理和编程能力,为AI推理能力发展树立了新的里程碑。