今天IBM公布了一款新软件,称其更容易训练机器学习模型,以便做出决策和从大数据中提取洞察。
这款名为Deep Learning Impact的软件工具,帮助用户开发的AI模型可使用流行的开源、深度学习框架,例如TensorFlow和Caffee,而且从12月开始这款工具将被添加到IBM的Spectrum Conductor软件中。
除了公布新软件之外,IBM还提到了基于Power9处理器的新系统,IBM在今年SC17大会上进行了展示。
IBM表示,这些系统是针对AI工作负载量身定制的,因为这些系统可以在Power9 CPU和硬件加速器(例如GPU和FPGA)之间加速传输数据,通常这些加速器是用与训练和运行机器学习模型的。
Power9系统还将在Power9处理器以及系统中其他加速器之间的高带宽连接。IBM表示,Power9将成为首个片上支持最新高速连接器(包括Nvidia下一代NVLink、OpenCAPI 3.0和PCIe 4.0)的商用平台。
IBM公司副总裁、认知系统开发研究员Brad McCredie表示:“我们看你到片上微处理器——处理片上集成——的时代正在终结,摩尔定律也将消失。”
“Power9让我们有机会尝试新的架构设计,通过跨系统堆栈实现数据带宽最大化,从而推动计算打破当前的限制。”
“Power9的基石是一个内部的信息高速公路,将处理进行分离,强化高级加速器来消化和分析海量数据集。”
下一代Nvidia NVLink和OpenCAPI互连将让附加GPU的性能明显高于x86系统中普遍采用的PCIe 3.0连接器所能实现的性能,而PCIe 4.0互连的速度将是PCIe 3.0的2倍。
IBM称,这个新的Power9系统最大的亮点,就是为美国能源部构建的Summit和Sierra超级计算机,也采用了Nvidia最新基于Volta的Tesla GPU加速器。Summit超级计算机预计性能将提升到是DOE Titan超级计算机的5到10倍。
IBM的重点是为可以有效处理多种类型芯片之间处理的系统奠定基础,这也是与Google、Mellanox、Nvidia和其他OpenPower Foundation成员共同努力的部分结果。
今年早些时候,IBM高级副总裁Bob Picciano谈到了IBM将如何计划打造能够更好地解决与使用AI分析非结构化数据相关工作负载的系统。
好文章,需要你的鼓励
尽管2026年智能手机外观可能变化不大,但内部技术正发生飞跃式进步。AI原生处理器、新型连接技术和先进显示系统正将日常设备转变为具备企业级功能的强大个人平台。这些趋势对企业和消费者同样重要,因为人们携带的手机决定了他们如何访问数据、协作办公、管理工作流程和使用数字服务。
卡内基梅隆大学团队提出DistCA技术,通过分离AI模型中的注意力计算解决长文本训练负载不平衡问题。该技术将计算密集的注意力任务独立调度到专门服务器,配合乒乓执行机制隐藏通信开销,在512个GPU的大规模实验中实现35%的训练加速,为高效长文本AI模型训练提供了新方案。
《时代》杂志宣布AI及其架构师为2025年度人物,包括扎克伯格、苏姿丰、马斯克等八位科技领袖。编辑认为今年是AI全面潜力显现的关键年份,这项技术加速了医学研究和生产力提升,让不可能变为可能。从企业高管到教师学生,所有人都在思考AI对生活的颠覆性影响。
清华大学研究团队提出3DThinker框架,首次让AI具备类似人类的三维空间想象能力。该系统在推理过程中插入特殊的三维想象符号,不依赖外部工具或大量标注数据,就能从有限的二维图像中构建三维心理模型。在多个空间推理基准测试中,3DThinker相比传统方法性能提升达50-100%,为自动驾驶、机器人导航、虚拟现实等领域的AI应用开辟了新路径。