re:Invent 2018：Amazon首次展示Inferentia定制机器学习预测芯片

今天AWS推出了一款专为机器学习设计的新处理器芯片，这也是Amazon在云计算领域雄心勃勃的另一个标志。

至顶网软件频道消息：今天AWS推出了一款专为机器学习设计的新处理器芯片，这也是Amazon在云计算领域雄心勃勃的另一个标志。

这款名为Inferentia的芯片将通过AWS EC2计算服务、SageMaker AI服务和（今天公布的新服务）Amazon Elastic Inference提供，旨在加速由机器学习模型执行的推理或预测过程，为Amazon Alexa和自动驾驶汽车等服务提供动力。

Inferentia芯片是由Amazon几年前成立的芯片设计公司Annapurna Labs设计，据称它与GPU（主要来自于Nvidia公司，一直是机器学习的首选芯片）相比具有低延迟和低成本等优点。

预计Inferentia芯片将于明年上市。AWS首席执行官Andy Jassy在今天上午的re:Invent大会主题演讲中简要介绍了Inferentia芯片，但他给出的设计或者规格细节很少，只是说Inferentia芯片支持多种数据类型和所有主流框架，如PyTorch和TensorFlow和MXNet。此外它还将提供数百的TOPS性能，聚合起来可以实现上千的TOPS性能。

Inferentia芯片是本周以来AWS宣布推出第二款芯片。周一晚上，AWS宣布推出名为Graviton的处理器，该处理器可通过AWS EC2云计算服务提供给云客户。Graviton是基于智能手机、网络路由器和各种其他设备中使用的Arm架构，并将逐渐用于计算机服务器中，例如AWS设计用于海量数据中心的计算机服务器。

Moor Insights＆Strategy总裁兼首席分析师Patrick Moorhead表示：“AWS宣布将自开自己的支持多种框架的机器学习推理芯片是一个重大的消息。与Google Cloud不同，这项AWS服务将广泛应用并具有弹性。目前AWS针对推理提供CPU、GPU、FPGA、以及现在自己的ASIC。”

在过去几年中我们看到，市场中出现了大量新芯片用于特定应用的优化，特别是机器学习和人工智能。例如，Google提供对自定义Tensor处理单元芯片的云访问。芯片设计兴起的一个原因是，所谓的超大规模数据中心企业需要对他们的硬件进行尽可能多的效率优化。

所有这些都让数据中心领导者英特尔处于了守势。英特尔收购了Altera和Movidius等多家公司，为其核心X86产品线增加了新的芯片设计和专业技术。此外英特尔还调整了X86芯片（如目前的至强产品线），以更好地应对机器学习和其他任务。

Amazon还发布了Elastic Inference，这是一项由GPU提供支持的深度学习推理加速服务。Jassy表示，这项服务仅根据需要提供尽可能多的AWS计算实例，可以节省高达75％的推理成本。

此外，AWS推出了一系列与人工智能相关的服务和产品，包括自主模型汽车Deep Racer，开发者可用来研究强化学习，预订价为249美元。

来源：siliconANGLE

0赞

好文章，需要你的鼓励

re:Invent 2018：Amazon首次展示Inferentia定制机器学习预测芯片

来源：siliconANGLE

2018

11/29

17:27

分享

点赞

Littelfuse推出首款具有SPDT和长行程且兼容回流焊接的发光轻触开关

至顶科技助力AI创业者，在HICOOL峰会探索“如何用AI赚到第一桶金”

CoreWeave LOTA技术实现对象数据高速全球传输

谷歌DeepMind与CFS合作开发核聚变等离子体AI控制系统

微软为Windows 11推出全新Copilot自动化功能

苹果研究人员探索AI如何预测Bug、编写测试并修复代码

刚果称全球最大水电站可为AI数据中心供电

HPE Alletra存储业务获得战略重点关注

谷歌DeepMind与核聚变初创公司合作的真实原因

Omdia预测：超大规模云市场销售额2030年将达1630亿美元

Oracle全面押注AI，用户仍在摸索应用路径

Aramex与AWS携手推进全球物流数字化转型

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

阿里要用AI将云计算重做一遍

PEC 2025 AI创新者大会

用AI，在数字身份验证风暴中心重构信任坐标

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: