8月22日,微软再次推出其针对实时人工智能的Brainwave深度学习加速平台。而微软正在逐步曝光其将深度学习平台带入可定制芯片的计划和细节,这将使Azure成为“人工智能云”。
微软至少在2016年就曾经好几次谈过Brainwave。这一次,Brainwave的推出出现在本周的Hot Chips 2017大会上。
Brainwave由高性能分布式系统架构构成,运行在被称为现场可编程阵列(FPGA)的可定制芯片上的硬件深层神经网络引擎之上,微软今天在Research博客文章中表示,其中还包括一个用于部署在受过训练的模型编译器。
如同个月在博客文章中提到的,根据微软在2016年推出的可配置云计划,Brainwave是运行在基于FPGA硬件微服务的深度学习平台。演示提到了数据中心或互联网上的“硬件加速即服务”(Hardware Acceleration as a Service)。Brainwave分布式神经网络模型可以按照需要跨越多个FPGA。
此外,微软计划七月份在公司最近于雷德蒙德举办的Faculty Research Summit上讨论Brainwave,但是最终改变了主意。
在Hot Chips 2017大会上,微软的官员们表示,使用英特尔新的Stratix-10芯片,Brainwave在没有批处理的情况下实现了39.5兆次运算的持续性能。微软认为:Brainwave将使Azure用户能够在这种级别的性能下运行复杂的深度学习模型。
这是微软在Hot Chips大会上演示文稿中的新架构图,它显示了Brainwave的组件:
微软正在寻求在硬件微服务器上运行的Brainwave,推动受到部署在云端人工智能影响的服务边界,包括计算机视觉、自然语言处理和语音。
微软表示,他们将在2018年内通过Azure为外部开发人员提供FPGA。而微软并不是唯一一家在自己的云数据中心期待FPGA的公司,目前亚马逊和谷歌都在使用定制硅完成人工智能任务。
好文章,需要你的鼓励
希腊塞萨洛尼基大学研究团队开发出MIR-L算法,通过"彩票假说"发现大型图像修复网络中的关键子网络。该算法采用迭代剪枝策略,将网络参数减少90%的同时保持甚至提升修复性能。MIR-L能同时处理去雨、去雾、降噪等多种图片问题,为资源受限设备的实时图像处理提供了高效解决方案,具有重要的实用价值和环保意义。
这项由OpenRouter公司团队和Andreessen Horowitz(a16z)投资机构联合开展的研究,于2025年12月发表。
卡内基梅隆大学团队提出DistCA技术,通过分离AI模型中的注意力计算解决长文本训练负载不平衡问题。该技术将计算密集的注意力任务独立调度到专门服务器,配合乒乓执行机制隐藏通信开销,在512个GPU的大规模实验中实现35%的训练加速,为高效长文本AI模型训练提供了新方案。