今天IBM公布了一款新软件,称其更容易训练机器学习模型,以便做出决策和从大数据中提取洞察。
这款名为Deep Learning Impact的软件工具,帮助用户开发的AI模型可使用流行的开源、深度学习框架,例如TensorFlow和Caffee,而且从12月开始这款工具将被添加到IBM的Spectrum Conductor软件中。
除了公布新软件之外,IBM还提到了基于Power9处理器的新系统,IBM在今年SC17大会上进行了展示。
IBM表示,这些系统是针对AI工作负载量身定制的,因为这些系统可以在Power9 CPU和硬件加速器(例如GPU和FPGA)之间加速传输数据,通常这些加速器是用与训练和运行机器学习模型的。
Power9系统还将在Power9处理器以及系统中其他加速器之间的高带宽连接。IBM表示,Power9将成为首个片上支持最新高速连接器(包括Nvidia下一代NVLink、OpenCAPI 3.0和PCIe 4.0)的商用平台。
IBM公司副总裁、认知系统开发研究员Brad McCredie表示:“我们看你到片上微处理器——处理片上集成——的时代正在终结,摩尔定律也将消失。”
“Power9让我们有机会尝试新的架构设计,通过跨系统堆栈实现数据带宽最大化,从而推动计算打破当前的限制。”
“Power9的基石是一个内部的信息高速公路,将处理进行分离,强化高级加速器来消化和分析海量数据集。”
下一代Nvidia NVLink和OpenCAPI互连将让附加GPU的性能明显高于x86系统中普遍采用的PCIe 3.0连接器所能实现的性能,而PCIe 4.0互连的速度将是PCIe 3.0的2倍。
IBM称,这个新的Power9系统最大的亮点,就是为美国能源部构建的Summit和Sierra超级计算机,也采用了Nvidia最新基于Volta的Tesla GPU加速器。Summit超级计算机预计性能将提升到是DOE Titan超级计算机的5到10倍。
IBM的重点是为可以有效处理多种类型芯片之间处理的系统奠定基础,这也是与Google、Mellanox、Nvidia和其他OpenPower Foundation成员共同努力的部分结果。
今年早些时候,IBM高级副总裁Bob Picciano谈到了IBM将如何计划打造能够更好地解决与使用AI分析非结构化数据相关工作负载的系统。
好文章,需要你的鼓励
当前企业面临引入AI的机遇与挑战。管理层需要了解机器学习算法基础,包括线性回归、神经网络等核心技术。专家建议从小规模试点开始,优先选择高影响用例,投资数据治理,提升员工技能。对于影子IT现象,应将其视为机会而非问题,建立治理流程将有效工具正式化。成功的AI采用需要明确目标、跨部门协作、变革管理和持续学习社区建设。
这项由东京科学技术大学等机构联合发布的研究提出了UMoE架构,通过重新设计注意力机制,实现了注意力层和前馈网络层的专家参数共享。该方法在多个数据集上显著优于现有的MoE方法,同时保持了较低的计算开销,为大语言模型的高效扩展提供了新思路。
美国垃圾收集行业2024年创收690亿美元,近18万辆垃圾车每周运营六至七天,每日停靠超千次。设备故障成为行业最大隐性成本,每辆车年均故障费用超5000美元。AI技术通过实时监控传感器数据,能提前数周预测故障,优化零部件库存管理,减少重复维修。车队报告显示,预测性维护每辆车年节省高达2500美元,显著提升运营效率和服务可靠性。
小米团队开发的MiMo-7B模型证明了AI领域"小而精"路线的可行性。这个仅有70亿参数的模型通过创新的预训练数据处理、三阶段训练策略和强化学习优化,在数学推理和编程任务上超越了320亿参数的大模型,甚至在某些指标上击败OpenAI o1-mini。研究团队还开发了高效的训练基础设施,将训练速度提升2.29倍。该成果已完全开源,为AI民主化发展提供了新思路。