至顶网软件频道消息: 谷歌今天开始在自己的公有云上提供了一个新的图形加速器,以更好的支持人工智能和虚拟桌面工作负载。
据悉,谷歌采用的芯片是Nvidia的P4,这让谷歌云平台支持的Nvidia GPU数量增加到4个,而且所有这些都是从2017年2月以来添加的。Nvidia扩展其GPU产品线的步伐反映了企业采用人工智能的速度越来越快。
P4的起价为每小时60美分,是4款GPU中价格第二低的。在处理最多4个字节的单精度值时,该芯片可提供5.5 teraflops的性能。
Nvidia还为P4配备了8GB GDDR5内存,专门设计用于GPU。片上芯片内存要比普通内存更快,因为让数据更接近GPU核心,从而减少延迟。
在人工智能部署方面,谷歌认为基于云的P4主要用于机器学习推理,也就是数据处理神经网络在经过适当训练之后可以在生产环境中做的事情,这是一种完全不同的任务,有时候利用更强大的GPU可以实现更好的性能。
P4也适用于虚拟桌面环境。它采用了Grid,这个Nvidia软件可以在多个虚拟机之间分配GPU硬件资源。此外,谷歌还支持合作伙伴Teradici的工具,该工具可以将运行在虚拟机中应用流式传输到员工的本地设备上。
谷歌瞄准的第三种场景是视频流。根据Nvidia的说法,该芯片有3个视频处理引擎,可以实时转码多达35个高清流。
另外,GPU在谷歌的技术战略中扮演着越来越重要的作用,因此Nvidia也成为谷歌的一个重要合作伙伴。话虽如此,但谷歌并不完全依赖于这家AI处理器的芯片制造商。谷歌还支持Tensor Processing Units,这款内部设计的芯片可定制用于运行神经网络,每个神经网络可提供180 teraflops的巨大计算能力。
好文章,需要你的鼓励
IBM Spyre加速器将于本月晚些时候正式推出,为z17大型机、LinuxONE 5和Power11系统等企业级硬件的AI能力提供显著提升。该加速器基于定制芯片的PCIe卡,配备32个独立加速器核心,专为处理AI工作负载需求而设计。系统最多可配置48张Spyre卡,支持多模型AI处理,包括生成式AI和大语言模型,主要应用于金融交易欺诈检测等关键业务场景。
加拿大女王大学研究团队首次对开源AI生态系统进行端到端许可证合规审计,发现35.5%的AI模型在集成到应用时存在许可证违规。他们开发的LicenseRec系统能自动检测冲突并修复86.4%的违规问题,揭示了AI供应链中系统性的"许可证漂移"现象及其法律风险。
意大利初创公司Ganiga开发了AI驱动的智能垃圾分拣机器人Hoooly,能自动识别并分类垃圾和可回收物。该公司产品包括机器人垃圾桶、智能盖子和废物追踪软件,旨在解决全球塑料回收率不足10%的问题。2024年公司收入50万美元,已向谷歌和多个机场销售超120台设备,计划融资300万美元并拓展美国市场。
这项由剑桥大学、清华大学和伊利诺伊大学合作的研究首次将扩散大语言模型引入语音识别领域,开发出Whisper-LLaDA系统。该系统具备双向理解能力,能够同时考虑语音的前后文信息,在LibriSpeech数据集上实现了12.3%的错误率相对改进,同时在大多数配置下提供了更快的推理速度,为语音识别技术开辟了新的发展方向。