ZD至顶网软件频道消息:1月21日,阿里云发布异构计算解决方案:弹性GPU实例和FPGA解决方案。
它们能为客户提供高效率、低延迟的实时计算。在数据安全性有保障的前提下,提供灵活弹性的异构计算资源。尤其适合人工智能创业者的应用。
弹性GPU产品2016年底开放邀测以来,视频、渲染和人工智能A.I等领域众多用户已在使用。
弹性GPU实例
弹性GPU实例是阿里云为客户定制的支持多家GPU的弹性计算GPU系列产品。
性能介绍
以最新的弹性GPU实例来看,它可以灵活提供2048到8192个并行处理核心,搭配32GB的DDR5显存,最高提供15.08TFOPS单精度和1TFLOPS双精度浮点性能。并支持多种开放的渲染与计算加速协议和软件框架。
最新的弹性GPU实例也配备了最新的实例存储功能,可以获得与SSD云盘相比十数倍性能提升的前提下,享受高性能实例存储的读写时延稳定性:高性能实例存储的读写延迟可稳定在200us左右。
弹性GPU实例在存储上还支持挂载云端3副本存储的高可靠性云盘存储。
网络方面,单实例的最大PPS更是达到超过600000+的收发包能力。
通过阿里云提供的海量计算能力,使用户可以用最低的使用成本、最大的弹性灵活度来运转自身的GPU需求业务。
该产品支持包月、包年的预付费支付模式,同时也支持按小时付费的使用模型。
客户案例
Zerolight是全球第一家在云上进行车辆效果三维展示的企业,业务范围囊括了全球许多著名的汽车企业,随着移动互联网带来的用户习惯迁徙,传统的照片或者预渲染展示技术的固定视角已经不能满足他们的需求。
2016年下半年,Zerolight基于云计算技术开发了实时汽车三维展示软件,将某品牌的进店率最高提升了70%。
ZeroLight公司大中华区总经理李善鹏表示:“我们的梦想是让不可见成为可见,基于弹性计算GPU系列产品,我们软件性能高出15~20%。我们相信弹性计算GPU系列产品提供的强大算力,能够很好的帮助我们实现我们的梦想。”
FPGA解决方案
阿里云采用了异构FPGA计算来加速阿里云基础设施和阿里云自有云业务,并且给客户提供了基于FPGA的加速解决方案,大大提高了客户关键业务的计算性能。
用户可以从开发环境、商业软件授权,到IP市场、镜像市场,再到硬件基础设施和网络设施,无缝接入阿里云产品,从而定制属于自己的个性化服务器来提高特定业务和算法的效率。
性能介绍
阿里云采用了多家FPGA方案。以 Arria 10 FPGA为例,它仅消耗 33 W 就能提供超过 1.5 TFLOPS 计算性能,单位能耗计算能力达 45 GFLOPS/W,深度学习每瓦性能是 Intel E5-2699 v3 CPU 的 4 倍。
在阿里云深度学习的语音识别的业务上,单块 FPGA 的方案相当于 64 个 2.5Ghz broadwell CPU 物理核的性能,而延迟只有 CPU 的一半。
客户案例
瑞为技术是国内领先的图像智能感知技术与解决方案提供商,其基于深度学习的动态视频实时分析系统在智能安防、智慧零售、智能家电等领域均有规模应用,目前同时在线的图像智能感知前端已达到十万量级,并且每年保持200%以上的高速增长率,后端服务器的处理压力也因此持续激增。
为解决这个问题,瑞为去年开始使用阿里云 FPGA 解决方案。
短短几个月,不仅实现了复杂的机器视觉与深度学习算法,处理速度也提升了一个数量级。
单台FPGA服务器一秒就能实现3000万次人脸比对,将IPC的接入能力提升至少5倍以上,且极大地降低了服务端建设费用,帮助有关部门实现了更有价值、更优质、更具有拓展性的服务部署。
发布,只是第一步
阿里云会持续在异构计算领域投入研发资源和资金支持,帮助客户解决GPU,FPGA等异构资源的计算需求,并且和客户一起携手丰富和完善异构计算领域周边生态建设,打造云上最强的异构计算的企业级解决方案。
好文章,需要你的鼓励
在迪拜Gitex 2025大会上,阿联酋成为全球AI领导者的雄心备受关注。微软正帮助该地区组织从AI实验阶段转向实际应用,通过三重方法提供AI助手、协同AI代理和AI战略顾问。微软已在阿联酋大举投资数据中心,去年培训了10万名政府员工,计划到2027年培训100万学习者。阿联酋任命了全球首位AI部长,各部门都配备了首席AI官。微软与政府机构和企业合作,在公民服务和金融流程等领域实现AI的实际应用,构建全面的AI生态系统。
浙江大学等高校研究团队开发的VolSplat系统,通过"体素对齐"替代传统"像素对齐"方法,实现了快速高质量的3D场景重建。该技术仅需6张普通照片即可生成精确3D模型,在RealEstate10K等标准数据集上显著超越现有方法,为机器人导航、增强现实、建筑设计等领域提供了新的技术选择,代表了3D重建领域从二维思维向三维思维的重要转变。
苹果与俄亥俄州立大学研究人员发布名为FS-DFM的新模型,采用少步离散流匹配技术,仅需8轮快速优化即可生成完整长文本,效果媲美需要上千步骤的扩散模型。该模型通过三步训练法:处理不同优化预算、使用教师模型指导、调整迭代机制来实现突破。测试显示,参数量仅1.7亿至17亿的FS-DFM变体在困惑度和熵值指标上均优于70-80亿参数的大型扩散模型。
武汉大学团队与字节跳动公司合作,提出MAPO混合优势策略优化方法,解决AI训练中的"一刀切"问题。该方法能根据问题难度动态调整评分策略,避免传统方法中的优势反转和优势镜像问题。通过轨迹确定性判断和权重动态调整,在几何推理和情感识别任务上都取得显著提升,为AI自适应学习提供新思路。