价格战全面爆发，IBM向Watson AI用例投放自研芯片

亚马逊、微软和VMware纷纷削减AI模型成本。

IBM声称将通过定制化芯片降低云端的AI模型运行成本，从而把握目前ChatGPT等生成模型掀起的市场热潮、扩大自身获利空间。

各大科技企业近期显然都希望能利用ChatGPT引起的AI关注度，但从种种现状来看，这种关注似乎正有转弱的趋势。OpenAI网站的流量在5月至6月期间估计下降了10%。

IBM表示，正在考虑使用内部原研的定制化AI芯片来降低云端Watsonx服务的运营成本。

今年5月发布的Watsonx是一款由三种产品组成的套件，专为希望借基础模型和生成式AI之力自动化/加速工作负载处理的企业客户而设计，且均能够在多种公有云及本地设施上运行。

IBM公司的Mukesh Khare在接受路透社采访时称，该公司目前正计划使用名为人工智能单元（AIU）的芯片支持IBM Cloud上运行的Watsonx服务。谈到蓝色巨人之前在Watson系统上遭遇的失败，他将原因归结于成本过高，并声称通过AIU的引入，IBM将有望发挥这些芯片的高能效优势、降低云端AI处理成本。

AIU于去年10月首次亮相，是一款具有 32个处理核心的专用集成电路（ASIC）。IBM称其衍生自支持z16大型机设备的Telum芯片中的AI加速器版本，能够接入任意计算机或服务器上的PCIe插槽。

亚马逊同样着力削减成本

与此同时，亚马逊也表示希望通过价格竞争吸引更多客户使用其AWS云平台，并宣布将提供更低的AI模型训练和运营成本。

云巨头AWS应用副总裁Dilip Kumar表示，ChatGPT等服务背后的AI模型需要大量算力方可实现训练和运营。而亚马逊云科技多年来积累下的核心经验，正是如何持续降低这方面成本。

据估计，ChatGPT可能用到超过570 GB的数据集进行训练，且配合使用超1000个英伟达A100 GPU。

Kumar在此前于奥斯汀举办的Momentum大会上评论称，最新一代AI模型的训练成本明显相当高昂，“而我们一直在承载大量无差别繁重工作，希望能帮助客户降低运营成本。”

Kumar认为，已经有很多组织将数据存储在AWS当中，所以选择亚马逊的AI服务也就成了顺理成章的决定。毕竟如果要将数据发送至其他应用环境，客户还得额外支付数据出口费。

但也有部分专家认为，云服务商可能还没做好满足AI服务新需求的准备。《华尔街日报》指出，新一代生成式AI模型的体量往往是上代模型的10到100倍，而且需要GPU等加速器基础设施协助加快处理速度。

亚马逊AWS EC2产品管理总监Chetan Kapoor也承认，在公有云服务商运营的基础设施当中，只有一小部分属于配备此类加速器的高性能节点。由于处理AI任务离不开这些加速器的加持，所以“供需之间存在相当严重的失衡”。

但这并没有阻挡各家云服务商扩展AI产品的脚步。Kapoor表示，AWS打算在明年扩大其AI优化型服务器集群，而微软Azure和Google Cloud据说也将新增AI基础设施。

微软去年还宣布与GPU制造商英伟达建立合作伙伴关系，双方将共同为Azure增添数万个英伟达A100和H100 GPU，为基于GPU的服务器实例和英伟达AI软件栈提供支持。

就连VMware也不甘落后，本周公布最新计划，将让生成式AI运行在其平台之上。如此一来，客户将能够轻松在VMware环境中高效操作大语言模型，甚至灵活调动跨多种云的基础设施资源。

来源：至顶网软件与服务频道

0赞

好文章，需要你的鼓励

价格战全面爆发，IBM向Watson AI用例投放自研芯片

亚马逊同样着力削减成本

来源：至顶网软件与服务频道

2023

07/17

10:43

分享

点赞

重磅！康迪科技获宁德时代首个重卡换电站设备订单

可实时交互的AI生成世界，腾讯发布的AI框架Yan，会是元宇宙的破局者吗？

CCF HPC China 2025｜联想 AI 基础设施 “一横五纵” 产品矩阵精彩亮相

智能体类型与记忆系统的深度解析

OpenAI CEO计划投入数万亿美元建设AI基础设施

心理学家和心理健康专家推动使用自定义指令让AI成为治疗辅助工具

HPE焕新品牌战略，进一步拓展中国市场合作伙伴生态

浏览器是智能体AI未来的关键吗？Opera和Perplexity这样认为

福特颠覆传统装配线生产模式 制造低成本美国电动车

研究员将OpenAI开源大语言模型逆向还原为无推理"基础模型"

Asmi Linux 13 Debian版本发布：Xfce桌面焕然一新

英伟达发布大规模AI就绪欧洲语言数据集和工具

性能狂飙70%！宝德 x 京东云AI存储一体机新品上市，重塑行业标杆

思科与英伟达扩大合作，助力企业加速应用AI技术

两位前谷歌软件工程师，用AI改写黑夜成像规则

德勤2025技术趋势报告，AI与企业未来的交汇

思科在Cisco Live阿姆斯特丹大会上展示简洁、安全和AI就绪的创新技术

区分“模型”和“应用”是对AI最大的误解

终端侧AI，如何从DeepSeek的连锁反应中受益？

Gartner发布2025年及未来中国企业实现AI价值的重要预测

专访DeepMind CEO：我们距离实现AGI只需5-10年

企业AI是确定性的长期主义

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

福特颠覆传统装配线生产模式制造低成本美国电动车