ZD至顶网软件频道消息:1月21日,阿里云发布异构计算解决方案:弹性GPU实例和FPGA解决方案。
它们能为客户提供高效率、低延迟的实时计算。在数据安全性有保障的前提下,提供灵活弹性的异构计算资源。尤其适合人工智能创业者的应用。
弹性GPU产品2016年底开放邀测以来,视频、渲染和人工智能A.I等领域众多用户已在使用。
弹性GPU实例
弹性GPU实例是阿里云为客户定制的支持多家GPU的弹性计算GPU系列产品。
性能介绍
以最新的弹性GPU实例来看,它可以灵活提供2048到8192个并行处理核心,搭配32GB的DDR5显存,最高提供15.08TFOPS单精度和1TFLOPS双精度浮点性能。并支持多种开放的渲染与计算加速协议和软件框架。
最新的弹性GPU实例也配备了最新的实例存储功能,可以获得与SSD云盘相比十数倍性能提升的前提下,享受高性能实例存储的读写时延稳定性:高性能实例存储的读写延迟可稳定在200us左右。
弹性GPU实例在存储上还支持挂载云端3副本存储的高可靠性云盘存储。
网络方面,单实例的最大PPS更是达到超过600000+的收发包能力。
通过阿里云提供的海量计算能力,使用户可以用最低的使用成本、最大的弹性灵活度来运转自身的GPU需求业务。
该产品支持包月、包年的预付费支付模式,同时也支持按小时付费的使用模型。
客户案例
Zerolight是全球第一家在云上进行车辆效果三维展示的企业,业务范围囊括了全球许多著名的汽车企业,随着移动互联网带来的用户习惯迁徙,传统的照片或者预渲染展示技术的固定视角已经不能满足他们的需求。
2016年下半年,Zerolight基于云计算技术开发了实时汽车三维展示软件,将某品牌的进店率最高提升了70%。
ZeroLight公司大中华区总经理李善鹏表示:“我们的梦想是让不可见成为可见,基于弹性计算GPU系列产品,我们软件性能高出15~20%。我们相信弹性计算GPU系列产品提供的强大算力,能够很好的帮助我们实现我们的梦想。”
FPGA解决方案
阿里云采用了异构FPGA计算来加速阿里云基础设施和阿里云自有云业务,并且给客户提供了基于FPGA的加速解决方案,大大提高了客户关键业务的计算性能。
用户可以从开发环境、商业软件授权,到IP市场、镜像市场,再到硬件基础设施和网络设施,无缝接入阿里云产品,从而定制属于自己的个性化服务器来提高特定业务和算法的效率。
性能介绍
阿里云采用了多家FPGA方案。以 Arria 10 FPGA为例,它仅消耗 33 W 就能提供超过 1.5 TFLOPS 计算性能,单位能耗计算能力达 45 GFLOPS/W,深度学习每瓦性能是 Intel E5-2699 v3 CPU 的 4 倍。
在阿里云深度学习的语音识别的业务上,单块 FPGA 的方案相当于 64 个 2.5Ghz broadwell CPU 物理核的性能,而延迟只有 CPU 的一半。
客户案例
瑞为技术是国内领先的图像智能感知技术与解决方案提供商,其基于深度学习的动态视频实时分析系统在智能安防、智慧零售、智能家电等领域均有规模应用,目前同时在线的图像智能感知前端已达到十万量级,并且每年保持200%以上的高速增长率,后端服务器的处理压力也因此持续激增。
为解决这个问题,瑞为去年开始使用阿里云 FPGA 解决方案。
短短几个月,不仅实现了复杂的机器视觉与深度学习算法,处理速度也提升了一个数量级。
单台FPGA服务器一秒就能实现3000万次人脸比对,将IPC的接入能力提升至少5倍以上,且极大地降低了服务端建设费用,帮助有关部门实现了更有价值、更优质、更具有拓展性的服务部署。
发布,只是第一步
阿里云会持续在异构计算领域投入研发资源和资金支持,帮助客户解决GPU,FPGA等异构资源的计算需求,并且和客户一起携手丰富和完善异构计算领域周边生态建设,打造云上最强的异构计算的企业级解决方案。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。