说起今年的“降价潮”,除了房地产以外,那就属大模型了。自从几家大模型厂商率先宣布降价后,这股风潮便席卷整个行业。阿里云、百度智能云等纷纷跟进,纷纷推出优惠政策,降低服务价格,试图在这场价格战中占据有利位置。
5月22日,腾讯云也加入大模型降价阵营。“全面降价,立即生效!”是腾讯云的承诺——其主力模型之一混元-lite模型的价格从0.008元/千tokens调整为全面免费,同时,API输入输出总长度计划从目前的4k升级到256k。主力模型之一混元-lite模型即日起全面免费。
图片来源:腾讯云
大模型的“价格战”进入到白热化阶段以来,“按分计价”的时代便一去不返,迎接我们的是“大幅降价”的按厘计价时代。
卷技术“不足” 卷价格“有余”
目前来看,国内的大型模型主要依靠提供API服务。但想要将AI真正应用到具体场景中,还有一段不短的路要走。
大多数AI应用需要在通用模型API的基础上,通过特定场景的数据训练和模型微调来优化性能。面对这一挑战,国内的大模型开发商在过去一年里进行了一系列创新尝试,目的是降低AI应用的门槛,从而增加模型的使用量。
事实上,尽管大模型提供商付出了不少努力,但标准化的模型API的增长并没有达到预期。了解到这一点,就不难看出为何会出现最近的降价行动——通过降价,虽然短期内收入可能不会有太大影响,但可以刺激市场活力,吸引更多企业开始免费试用,加速AI技术在业务流中的实际应用。
通过降低价格,腾讯云及其它厂商旨在降低技术应用的门槛,使得更多企业和开发者能够尝试和利用先进的AI技术。这种策略不仅促进了各行业的智能化转型和创新,也扩大了大模型技术的应用场景和影响力。
自从降价以后,腾讯云的混元大模型用户量在中小企业和初创公司中显著增长,使用场景的多样化进一步推动了大模型技术的发展和优化。腾讯云通过持续的技术升级和优化,确保在各类应用场景中提供卓越的性能,从而保持市场领导地位。
目前,腾讯混元提供了能提取与应用图像的边缘(canny)、深度(depth)、人体姿势(pose)等条件的三个首发ControlNet模型,让开发者直接使用其进行推理。这三个ControlNet插件能实现通过线稿生成全彩图、生成具有同样深度结构的图、生成具有同样姿态的人等能力。同时,混元DiT也开源了ControlNet的训练方案,开发者与创作者可以训练自定义的ControlNet模型。
不久前,混元DiT更是发布的专属加速库,可将推理效率进一步提升,生图时间缩短75%。同时模型易用性大幅提升,用户可以基于ComfyUI的图形化界面,使用混元DiT,或者通过Hugging Face Diffusers通用模型库,仅用三行代码即可调用混元DiT模型,无需下载原始代码库。
然而,此次降价策略也给内部技术研发团队带来了新的挑战。由于技术发展需要长期积累和高昂的研发成本,许多公司面临技术突破不如预期的问题,难以在技术上形成绝对的竞争优势,从而推动市场通过技术创新。技术团队需要在有限的资源下维持高水平的创新和开发能力,提高效率,同时确保服务质量,开发出更具成本效益的技术解决方案。
尽管面临这些挑战,腾讯云的技术团队仍致力于提升混元大模型的性能和功能。最近的技术更新包括优化算法,提高模型的训练和推理速度及准确性;扩展功能,以支持更多应用场景和数据类型;以及提升用户体验,通过改进用户界面和技术支持来增强用户的使用体验和满意度。这些更新确保混元大模型能在快速变化的市场中保持竞争力,并满足不断增长的用户需求。
大模型同样遵循“摩尔定律”
从手机行业到网约车、共享单车,再到社区团购和电动车制造,每一场技术与商业的“大战”不仅推动了行业的快速发展,也使得参与者们在激烈的市场竞争中寻找新的生存与发展之道。
在技术的世界里,变革总是伴随着激烈的竞争和不断的创新。如今,大模型领域亦步入了这一阶段,同样显示出类似的模式和挑战。在这些看似不同的赛道中,一个共同的主题浮现——技术的边际差异化正在缩小,使得竞争日趋激烈。
在大模型技术的发展上,国内外的云厂商同样遵循着一种类似“摩尔定律”和规模效应。即技术成本的不断降低与性能的持续提升。像Open AI等国际领先企业就是通过不断优化其模型和算力成本,已经实现了在全球范围内的价格降低,促使更广泛的应用场景成为可能。国内厂商也不甘落后,纷纷通过加速技术迭代和优化服务,试图在B端和C端市场占据一席之地。
然而,单纯的价格竞争并不能决定市场的最终赢家。真正的关键在于如何将先进的技术转化为实际应用,并在此基础上实现商业模式的创新。对于云厂商而言,在底层算力和AI平台持续创新,通过强化云管理、应用、计算及基础架构的整体能力,为大模型的商业应用提供了强有力的支持。这种从技术到商业应用的全链条创新,是未来竞争中至关重要的因素。
随着大模型技术的不断成熟和应用的广泛推广,公有云市场的潜力正在逐步释放。公有云不仅能为大模型运行的提供技术基础,其广泛的应用场景也正成为推动创新的新引擎。未来,随着AI推理市场的进一步爆发,依托公有云的大模型将可能开创新的增长曲线,为整个行业带来更多的商业机会和创新可能。
在这场持续的技术革命和市场竞争中,只有不断探索和创新,才能在竞争中稳固自己的地位,并最终赢得市场的长期青睐。
好文章,需要你的鼓励
这项由浙江大学与阿里巴巴通义实验室联合开展的研究,通过创新的半在线强化学习方法,显著提升了AI界面助手在多步骤任务中的表现。UI-S1-7B模型在多个基准测试中创造了7B参数规模的新纪录,为GUI自动化代理的发展开辟了新的技术路径。
阿里巴巴联合浙江大学开发的OmniThink框架让AI学会像人类一样慢思考写作。通过信息树和概念池的双重架构,系统能够动态检索信息、持续反思,突破了传统AI写作内容浅薄重复的局限。实验显示该方法在文章质量各维度均显著超越现有最强基线,知识密度提升明显,为长文本生成研究开辟了新方向。
新加坡国立大学研究人员开发出名为AiSee的可穿戴辅助设备,利用Meta的Llama模型帮助视障人士"看见"周围世界。该设备采用耳机形态,配备摄像头作为AI伴侣处理视觉信息。通过集成大语言模型,设备从简单物体识别升级为对话助手,用户可进行追问。设备运行代理AI框架,使用量化技术将Llama模型压缩至10-30亿参数在安卓设备上高效运行,支持离线处理敏感文档,保护用户隐私。
腾讯混元3D 2.0是一个革命性的3D生成系统,能够从单张图片生成高质量的带纹理3D模型。该系统包含形状生成模块Hunyuan3D-DiT和纹理合成模块Hunyuan3D-Paint,采用创新的重要性采样和多视角一致性技术,在多项评估指标上超越现有技术,并提供用户友好的制作平台。作为开源项目,它将大大降低3D内容创作门槛,推动3D技术的普及应用。