Google Cloud近日详细介绍了Axion,一款基于Arm核心设计的、内部开发的CPU。
Google Cloud首席执行官Thomas Kurian在美国拉斯维加斯举行的Cloud Next大会发表主题演讲时推出了这款CPU。在这次活动上,Google Cloud还宣布最新的AI加速器TPU v5p全面上市,这款芯片在处理浮点数(AI模型常用的数据单元)时性能是前身的2倍。
Google Cloud机器学习、系统和云AI副总裁Amin Vahdat在一篇博客文章中表示:“阿姆达尔定律表明,随着加速器的不断改进,通用计算将主导成本并限制我们的基础设施能力,除非我们做出相应的投资来跟上步伐。”
基于Arm的架构
Google Cloud尚未分享Axion架构的详细信息,例如它包含多少个核心以及板载缓存的数量。Google Cloud表示,有关该芯片设计的更多信息将于今年晚些时候公布,不过确实透露称,Axion是基于Arm Neoverse V2 CPU核心设计的。
Neoverse V2是在2022年推出的,针对云数据中心和其他高性能计算环境进行了优化,速度是Arm上一代核心设计的2倍。据该芯片制造商称,这种加速的一部分原因是进行了优化,使得Neoverse V2能够更快地处理整数——许多类型计算中使用的常见数据单位。
基于Neoverse V2的处理器可以配备多达256个核心和512MB缓存,还可以使用Arm最新的指令集架构ARMv9。芯片的指令集架构包括用于表达计算的机器语言和某些相关技术。
Neoverse V2支持的ARMv9功能之一,是一种称为Memory Tagging Extension的网络安全机制。据Arm称,它把连接到芯片的内存分成16位段,并向每个段添加四个附加位,充当一种锁。只有有权访问内存段的应用才能通过锁定,从而降低了黑客攻击的风险。
Neoverse还支持ARMv9的PDP(性能定义功率)功能,此功能可以通过降低CPU的最大性能来提高CPU的能效。
定制云芯片
Google Cloud在自己的数据中心内出了部署Axion处理器之外,还会部署一套名为Titanium的基础设施优化系统,它将卸载Axion处理器的一些任务,为客户工作负载留下更多计算能力。据Google Cloud称,Titanium是由三套内部开发的芯片组成的。
Titanium系统使用了名为Titan的微控制器或简单处理器作为Axion的信任根。信任根是一个硬件模块,可以防止黑客在服务器启动时将恶意代码引入服务器。据 Google Cloud称,Titan还有助于保护数据中心的网络流量。
Axion将把处理用户网络流量所涉及的一些计算转给名为TOP的定制芯片,该芯片也是Titanium系统的一部分。与此同时,第三个名为Titanium适配器的定制处理器也可以帮助运行为Google Cloud实例提供支持的虚拟化软件。Hyperdisk是Google Cloud的块存储服务,承担了一些原本由Axion执行的计算任务,以进一步提高性能。
“Axion处理器为Web和应用服务器、容器化微服务、开源数据库、内存缓存、数据分析引擎、媒体处理、基于CPU的AI训练和推理等通用工作负载带来了巨大的性能飞跃,”Vahdat详细说道。
Google Cloud表示,与竞争对手最快的Arm通用实例相比,基于Axion的实例的性能提高了30%。此外Google Cloud还承诺,与基于英特尔芯片的实例相比,处理速度提高了50%,能效提高60%。Google Cloud计划在今年晚些时候向客户提供Axion。
Google Cloud还将使用该芯片为多个内部工作负载提供支持。Google已经开始重组其数据中心,在基于Arm的硬件上运行某些Google Cloud服务、YouTube广告系统和Google Earth Engine卫星图像分析平台,并计划在不久的将来在Axion支持的服务器上部署其中一些工作负载。
好文章,需要你的鼓励
Adobe 周二宣布推出适用于 Android 系统的 Photoshop 应用测试版,提供与桌面版相似的图像编辑工具和 AI 功能,初期免费使用,旨在吸引更多偏好手机创作的年轻用户。
弗吉尼亚大学研究团队开发了TruthHypo基准和KnowHD框架,用于评估大语言模型生成生物医学假设的真实性及检测幻觉。研究发现大多数模型在生成真实假设方面存在困难,只有GPT-4o达到60%以上的准确率。通过分析推理步骤中的幻觉,研究证明KnowHD提供的基础依据分数可有效筛选真实假设。人类评估进一步验证了KnowHD在识别真实假设和加速科学发现方面的价值,为AI辅助科学研究提供了重要工具。
文章详细介绍了Character.AI这款主要面向娱乐、角色扮演和互动叙事的AI聊天工具的原理、用户群体、特色功能以及面临的法律与伦理争议,同时揭示了其新推出的视频和游戏互动体验。
亚马逊Nova责任AI团队与亚利桑那州立大学共同开发了AIDSAFE,这是一种创新的多代理协作框架,用于生成高质量的安全策略推理数据。不同于传统方法,AIDSAFE通过让多个AI代理进行迭代讨论和精炼,产生全面且准确的安全推理链,无需依赖昂贵的高级推理模型。实验证明,使用此方法生成的数据训练的语言模型在安全泛化和抵抗"越狱"攻击方面表现卓越,同时保持了实用性。研究还提出了"耳语者"代理技术,解决了偏好数据创建中的困难,为直接策略优化提供了更有效的训练材料。