ZD至顶网软件频道消息:微软在亚特兰大召开的Ignite大会上宣布,该公司现在已经在使用Intel Altera Field Programmable Gate Arrays (FPGA)芯片来加速Azure服务了。
FPGA芯片的目标是将硬件的性能优势和软件的灵活性结合起来。它们集成了可以重新配置的电路,这些电路在生产出来之后,可以通过下载新的硬件配置进行重新配置,因此实现了“现场可编程”。
始于2010年的微软Catapult项目是一个通过该公司数据中心的FPGAs网络加速云计算的项目。
现在该公司宣布它指的是全世界最大的FPGA部署项目。在三年左右的时间里,微软已经在其安装的每一台服务器中包含了Altera FPGA。Altera这家专业的FPGA厂商于2015年被英特尔收入囊中。这个FPGA网络将被用于加速人工智能等服务。
微软表示目前的计划是在五个大洲部署十五个国家,不过该公司没有透露进一步的细节。比较新的数据中心,例如最近在英国开张的数据中心可能会适当地配备这种技术。
微软杰出工程师Doug Burger对《The Reg》表示,“真正重要的是我们已经如何构建了这个系统。”他表示,“FPGA直接介于服务器和网络之间,所以所有的通信都会通过它。CPU可以通过PCIe和它对话,但是FPGA也可以通过网络彼此对话。所以在某种意义上,它是一种被插入到我们的云平台之中的、新型计算机。这一层可以组网,可以做人工智能,它还可以做其他的事情。这是一种结构上的重大改变。”
所有的网络通信都要通过FPGA这一事实让微软能够在某种程度上独立于服务器使用FPGA而不总是需要通过主机服务器。同时,这种设计带来了新的风险,因为bug和故障会影响到整个系统。Burger表示,这是最关键的挑战。
“你是在一个非常成熟的系统中投入了一种外来技术。所有的网络通信都要通过它。如果你搞砸了,你就会造成实实在在的损害。你想想大规模可靠性、故障诊断、健康监测、调试、版本管理、软件包管理,所有的这一切都需要内置于平台之中。没有人已经做到了这么大的规模。”
不过好处是对于某些特定任务的大幅度提速。Burger表示,“如果你成功部署了FPGA,提速的幅度将在10倍到1000倍之间。通常这个数值会略微超过10倍。”
微软允许开发人员上传他们自己的FPGA映像运行在Azure之上吗?Burger表示,“这是潜在的业务。”他表示,“不过我们还没有宣布任何实现它的计划或者时间表。”
好文章,需要你的鼓励
在AI智能体的发展中,记忆能力成为区分不同类型的关键因素。专家将AI智能体分为七类:简单反射、基于模型反射、目标导向、效用导向、学习型、多智能体系统和层次化智能体。有状态的智能体具备数据记忆能力,能提供持续上下文,而无状态系统每次都重新开始。未来AI需要实现实时记忆访问,将存储与计算集成在同一位置,从而创造出具备人类般记忆能力的数字孪生系统。
中国人民大学和字节跳动联合提出Pass@k训练方法,通过给AI模型多次答题机会来平衡探索与利用。该方法不仅提升了模型的多样性表现,还意外改善了单次答题准确率。实验显示,经过训练的7B参数模型在某些任务上超越了GPT-4o等大型商业模型,为AI训练方法论贡献了重要洞察。
OpenAI首席执行官阿尔特曼表示,公司计划在不久的将来投入数万亿美元用于AI基础设施建设,包括数据中心建设等。他正在设计新型金融工具来筹集资金。阿尔特曼认为当前AI投资存在过度兴奋现象,类似于90年代互联网泡沫,但AI技术本身是真实且重要的。他承认GPT-5发布存在问题,并表示OpenAI未来可能会上市。
南加州大学等机构研究团队开发出突破性的"N-gram覆盖攻击"方法,仅通过分析AI模型生成的文本内容就能检测其是否记住了训练数据,无需访问模型内部信息。该方法在多个数据集上超越传统方法,效率提升2.6倍。研究还发现新一代AI模型如GPT-4o展现出更强隐私保护能力,为AI隐私审计和版权保护提供了实用工具。