IBM的研究人员为了满足算法对处理能力看似无休止的需求推出了一种新的方法,这可能意味着深度学习应用的大变化:执行计算的处理器用的完全是光而不是电。
IBM的研究人员根据光粒子的特性创造了一个光子张量核,该光子张量核能够以前所未有的速度处理数据,可用于超低延迟的人工智能应用。虽然该光子张量核设备只进行了小规模的测试,但有关报告指,该处理器经开发后,可以实现每秒每平方毫米一千万亿次的乘累加(MAC)操作;据IBM的科学家说,这样的速度是靠电信号的 "最先进人工智能处理器 "的两倍多。
IBM多年来一直在研究新型的处理单元方法。部分研究集中在开发内存计算技术上,内存计算指内存和处理以某种形式共存。这样做可以避免在处理器和各个随机存取内存单元之间传输数据,可以节省能源及减少延迟。
IBM的研究人员去年曾宣布成功开发了一种全光学的内存处理方法:他们将内存计算集成在一个光芯片上,利用光执行计算任务。该团队还做了部分实验证明利用该技术可以有效地进行基本的标量乘法。
IBM研究院的工作人员Abu Sebastian在一篇新的博客文章中称目前使用基于光的内存处理器达到了一个新的里程碑。该团队建立了一个光子张量核,该处理核可以执行复杂的矩阵数学运算,特别适合深度学习应用。光子张量核的实现将基于光的内存处理技术推进到了新的阶段。基于光的张量核可用于执行名为卷积的运算,卷积运算对于处理图像等视觉数据非常有用。
IBM研究院的研究人员Abu Sebastian告诉记者,“我们在2019年的实验主要是为了展示该技术的潜力。标量乘法离任何现实生活中的应用都是那么遥远。而现在我们实现了整个卷积处理器,该卷积处理器大可用做深度神经网络的一部分。这样的卷积将是光学处理的杀手级应用。从这个意义上说,这已经是相当大的一步了。”
基于光的设备相比于基于电的设备最显著的优势是速度大大加快。IBM开发的技术利用光学物理学原理可以在单核里并行运行复杂的运算,每次的计算使用光学波长不同。IBM的科学家们再结合内存计算实现了远非电子电路可以比拟的超低延迟。因此,对于一些需要极低延迟的应用而言,光子处理的速度可能将带来极大的变化。
Sebastian提到自动驾驶汽车的例子,这地方检测速度可能关乎拯救生命。他表示,"假如你在高速公路上以每小时100英里的速度行驶,而且需要在一定距离内检测一些东西,在某些情况下,你靠现存的技术做不到。但用了基于光子的系统,那种响应速度比电子方法好了几个数量级。"
IBM开发的基于光子的处理器具有同时执行多项操作的能力,所需的计算密度也就要低得多。据Sebastian说,这可能是另一个关键的差异化因素:这位科学家说,在未来的某个时候,那种靠汽车后备箱一排排传统GPU支持的超级复杂的人工智能系统是肯定不能满足需要的。大多数大型车企现在都在开设自己的人工智能研究中心,Sebastian认为,自动驾驶车辆是基于光的处理器的重要应用。他表示,"自动驾驶领域的确需要低延迟推理,而目前还没有任何技术可以满足这个需求。这是一个独特的机会。"
IBM团队虽然已成功设计及测试了一个强大的核,但他们仍需扩充试验,以确保该项技术可以整合到系统层面上及确保端到端的性能。Sebastian表示,“我们还需要在这一块做更多的工作。”据这位科学家介绍,相关的工作已经展开,而且,随着研究的深入,可能出现更多的应用。计算领域的光换电无疑是一个值得关注的点。
好文章,需要你的鼓励
OpenAI CEO描绘了AI温和变革人类生活的愿景,但现实可能更复杂。AI发展将带来真正收益,但也会造成社会错位。随着AI系统日益影响知识获取和信念形成,共同认知基础面临分裂风险。个性化算法加剧信息茧房,民主对话变得困难。我们需要学会在认知群岛化的新地形中智慧生存,建立基于共同责任而非意识形态纯洁性的社区。
杜克大学等机构研究团队通过三种互补方法分析了大语言模型推理过程,发现存在"思维锚点"现象——某些关键句子对整个推理过程具有决定性影响。研究表明,计划生成和错误检查等高层次句子比具体计算步骤更重要,推理模型还进化出专门的注意力机制来跟踪这些关键节点。该发现为AI可解释性和安全性研究提供了新工具和视角。
传统数据中心基础设施虽然对企业至关重要,但也是预算和房地产的重大负担。模块化数据中心正成为强有力的替代方案,解决企业面临的运营、财务和环境复杂性问题。这种模块化方法在印度日益流行,有助于解决环境问题、满足人工智能的电力需求、降低成本并支持新一代分布式应用。相比传统建设需要数年时间,工厂预制的模块化数据中心基础设施可在数周内部署完成。
法国索邦大学团队开发出智能医学文献管理系统Biomed-Enriched,通过AI自动从PubMed数据库中识别和提取高质量临床案例及教育内容。该系统采用两步注释策略,先用大型AI模型评估40万段落质量,再训练小型模型处理全库1.33亿段落。实验显示该方法仅用三分之一训练数据即可达到传统方法效果,为医学AI发展提供了高效可持续的解决方案。