ZD至顶网软件频道消息:谷歌公司在去年5月的I/O开发者大会上公布了其正在内部开发的芯片方案,且专门用于运行人工智能型工作负载。消息一出,即引起技术行业的高度关注。近一年之后,搜索巨头终于开始将该处理器与商业解决方案加以匹配。
谷歌公司研究团队的成员们今天发布了一篇论文,宣称该系统在多个重要方面成功击败目前同一领域中的重量级中央处理器与图形处理单元竞争对手。其中一项为功耗水平,该芯片所采用的Tensor处理单元相较于英特尔Haswell CPU与英伟达Tesla K80 GPU可实现每瓦30至80倍的处理能力提升。
谷歌公司的TSU亦同样处于业界先进水平。内部测试结果显示,该芯片能够在处理AI工作负载时持续提供远超其它商用型替代方案的性能水平——提升幅度达15到30倍。谷歌公司在试用期间曾用于测试的项目之一——论文中仅将其命名为CNN1——则可实现70倍的运行速度改善。
谷歌公司的工程师们已经将以上一切功能特性整合至一块比英伟达K80体积更小的芯片之上。其接入一块能够与谷歌内部数据中心所使用之定制化服务器机架的内部磁盘驱动器插槽相适配的主板当中。根据搜索巨头的介绍,目前该公司拥有超过100个内部团队正在使用TSU以支持其街景视图及其它关键服务的语音识别功能。
谷歌公司并非惟一一家根据自身特定需求进行芯片优化的网络巨头。事实上,微软公司与Amazon也同样在委托英特尔为其打造定制化处理器,从而支撑其公有云服务。另外,零售巨头还拥有一家名为Annapurna Labs的子公司,专门销售用于网络设备的专用型芯片。
值得一提的是,这些芯片已经开始实际用于处理AI工作负载,谷歌将这种处理能力称为“推理”。Moor Insights & Strategy公司总裁兼首席分析师Patrick Moorhead指出,目前机器学习模型的训练过程仍然需要消耗大量服务器设备内的CPU与GPU资源。
好文章,需要你的鼓励
ServiceNow宣布将以超过10亿美元收购身份安全平台Veza,这是该公司2025年一系列AI和数据重点收购的最新举措。此次收购正值企业加速部署AI代理之际,而如何管理这些非人类身份的访问权限和输出已成为普遍难题。该交易将为ServiceNow的AI控制塔提供关键的身份治理能力,帮助企业建立统一的控制平面来定义上下文相关的权限、监控代理行为并大规模执行最小权限访问策略。
字节跳动等机构联合发布GAR技术,让AI能同时理解图像的全局和局部信息,实现对多个区域间复杂关系的准确分析。该技术通过RoI对齐特征重放方法,在保持全局视野的同时提取精确细节,在多项测试中表现出色,甚至在某些指标上超越了体积更大的模型,为AI视觉理解能力带来重要突破。
在生成式AI热潮中,只有英伟达和台积电真正赚到钱,其他AI产业链公司要么亏损要么利润被稀释。博通虽然在数据中心网络领域有不错的利润率,但为了不被AI浪潮抛弃,也选择进入AI业务。博通拥有730亿美元的AI积压订单,但被迫成为AI系统集成商,进一步稀释利润。第四季度博通收入180亿美元,同比增长28.2%,AI芯片收入达65亿美元。
Inclusion AI团队推出首个开源万亿参数思维模型Ring-1T,通过IcePop、C3PO++和ASystem三项核心技术突破,解决了超大规模强化学习训练的稳定性和效率难题。该模型在AIME-2025获得93.4分,IMO-2025达到银牌水平,CodeForces获得2088分,展现出卓越的数学推理和编程能力,为AI推理能力发展树立了新的里程碑。