在互联网企业的竞技场上,价格战早已司空见惯。通常,价格战会出现在行业发展的中后期,那时技术和市场都趋于成熟、竞争格局明朗,厂商通过降价策略抢夺蛋糕。但在大模型行业,情况却不尽相同,这场价格战打得异常激烈且提前到来,企业们尚未收回前期烧掉的钱,竞争的火焰就已熊熊燃起。
从上个月初开始,国内的大模型企业纷纷调降产品和服务的价格。在一连串“全线降价”和“远低于行业均价”的营销声浪中,百度智能云直接宣布两款主力模型免费,且立即生效,此举无疑撼动了整个大模型市场的价格体系。
那么,百度云为什么要采取这样激进的策略?
大模型厂商集体“赔钱赚吆喝”?
事实上,国内这场大模型价格战是从AI公司DeepSeek开始的。5月6日,DeepSeek率先将旗下对标GPT-4的大模型DeepSeek-V2价格大幅下调至GPT-4-Turbo的1%,每百万tokens仅需1元。紧接着,智谱AI和字节跳动也相继调整价格,形成了一股降价潮。
面对这一趋势,其他模型厂商不得不加入价格战。阿里云将通义千问主力模型Qwen-Long价格直降97%,声称“击穿全球底价”。而仅过了数小时,百度智能云便宣布其文心大模型的ENIRE Speed和ENIRE Lite模型全面免费。据了解,该两款模型免费开放半个月内,日调用量翻了10倍。
当前的价格战主要体现在token降价的层面上。从商业模式的角度看,大模型厂商把经过训练的模型以API形式销售,计费法则一般按token所对应的汉字、字母的使用量来计算,有些类似于我们熟悉的手机流量套餐,只不过变了计算单位。
不过要注意的是,大模型行业尚未成熟,核心依然是提升技术和拓展应用。当前的价格战不仅是厂商们对市场焦虑的反应,也显示了在用户增长停滞和缺乏市场爆款应用的背景下,降价成为吸引开发者和用户的首选策略。大模型厂商试图以价格上的“退”,换取用户增长上的“进”。
而对于兼具大模型厂商和云服务商双重身份的百度云、阿里云、腾讯云来说,这场价格战可能不只是单纯的价格竞争,更是一种通过低价大模型吸引用户,进而拉动背后云消费的战略。
当然,这并非是盲目降价,随着大模型技术的不断发展和优化,大模型推理成本已经大幅下降,模型训练所需的边际时间和资源也逐渐减少,因此大模型厂商们有了更多底气来调整价格。
百度创始人、董事长兼首席执行官李彦宏就曾透露,相比一年前,文心大模型的训练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理成本则降到了原来的1%。换言之,客户原来一天调用1万次,同样成本之下,现在一天可以调用100万次。
百度智能云事业群总裁沈抖强调,“价格只是消费者选择大模型的一个考量因素。比起价格,更重要的是模型效果、应用场景、已落地案例。这几年,百度一直在用技术手段降低企业使用大模型的成本,尤其是业界最高效的AI异构算力管理平台和‘一云多芯’。我们希望通过降价让大家创新的胆子更大一些、步子更快一些,快速探索并复制更多大模型可能的应用场景。”
不论怎样,大模型价格下降对市场和消费者都是利好,AI应用门槛降下来,企业创新试错的成本在很大程度上减小了,就会有更多的人使用,而大的使用量,才能打磨出好模型。
AI大模型给百度带来了什么?
作为中国首个发布大模型的平台,百度在这一领域拥有明显的先发优势,AI产品体系相对完备。百度的文心大模型系列涵盖了旗舰版的ERNIE 3.5和4.0,和轻量版的ERNIE Speed、Lite、Tiny等多个版本。这次百度免费开放的便是ENIRE Speed和ENIRE Lite这两款小尺寸模型,这两款产品都在今年3月推出,支持8K和128k的上下文长度。
根据官方介绍,百度自研的大语言模型ENIRE Speed,通用能力优异,适合作为基座模型进行精调,更好地处理特定场景问题,并具备优秀的推理性能。而ENIRE Lite作为百度自研的轻量级大语言模型,兼顾优异的模型效果与推理性能,适合低算力AI加速卡推理使用。
尽管这两款模型的规模不大,但对于初创企业和开发者来说或许已经足够。百度创始人、董事长兼首席执行官李彦宏在2024百度AI开发者大会上表示:“小模型推理成本低,响应速度快,在一些特定场景中,经过SFT(监督)精调后的小模型,它的使用效果可以媲美大模型。这就是我们发布ERNIE Speed、Lite、Tiny三个轻量模型的原因。”
从文心大模型的实际应用情况看,据了解,其每日处理的Tokens文本数量约为2500亿,日均API调用量超过2亿次,服务的客户或企业数量达到8.5万,可以看出市场对百度AI技术的需求强劲。
AI大模型也为百度云带来了新的收入来源。反映在财务数据上,百度2024年Q1财报显示,百度总营收315亿元,同比增长1%,智能云业务部分营收47亿元,同比增长12%,其中有6.9%来自外部客户使用大模型及生成式AI相关服务。以此计算,当季生成式AI给百度云带来的收入约为3.24亿元。
在当前激烈价格战的背景下,厂商们急需在持续的技术创新和成本控制之间找到平衡点,百度亦是如此。而这场提前开始的价格战,大概率会加速大模型行业的“大浪淘沙”,但这似乎也是行业发展过程中的必经阶段。
好文章,需要你的鼓励
五家光学存储初创公司正在开发长期存储技术,旨在用超过100年寿命的光学介质替代只有5-7年寿命的磁带。这些公司包括Cerabyte、Ewigbyte、HoloMem、Optera和SPhotonix,它们的技术类似微软Project Silica项目。光学存储介质具有更强的化学、冲击、辐射、水和热抗性,同时保持低能耗和高容量特性。
卡内基梅隆大学团队提出DistCA技术,通过分离AI模型中的注意力计算解决长文本训练负载不平衡问题。该技术将计算密集的注意力任务独立调度到专门服务器,配合乒乓执行机制隐藏通信开销,在512个GPU的大规模实验中实现35%的训练加速,为高效长文本AI模型训练提供了新方案。
Nutanix发布分布式主权云产品组合更新,为多云环境提供更安全的运营和管理功能。该解决方案支持企业在分布式环境中灵活部署和治理基础设施,运行传统虚拟机、现代云原生和AI应用。新功能包括支持完全断网环境的暗站点管理、政府云集群正式发布、Kubernetes平台增强安全合规性、企业AI平台集成NVIDIA微服务,以及云平台新增跨站点灾难恢复能力,为用户提供统一管理和运营简化体验。
清华大学研究团队提出3DThinker框架,首次让AI具备类似人类的三维空间想象能力。该系统在推理过程中插入特殊的三维想象符号,不依赖外部工具或大量标注数据,就能从有限的二维图像中构建三维心理模型。在多个空间推理基准测试中,3DThinker相比传统方法性能提升达50-100%,为自动驾驶、机器人导航、虚拟现实等领域的AI应用开辟了新路径。