根据Gartner的最新预测,到2023年,全球最终用户在公有云服务上的支出预计将增长21.7%,达到5973亿美元,高于2022年的4910亿美元。云计算正在推动下一阶段的数字化业务,各种组织在投身于生成人工智能、Web3和元宇宙等新兴技术。
Gartner副总裁分析师Sid Nag表示:“超大规模云提供商正在推动云议程。”“今天的组织将云视为数字化转型的高度战略平台,随着数字服务竞争的加剧,组织要求云提供商提供更复杂的功能。”
Nag补充表示:“例如,由大型语言模型(LLM)支持的生成式人工智能需要强大且高度可扩展的计算能力来实时处理数据。”“云提供了完美的解决方案和平台。生成式人工智能竞赛中的主要玩家都是超级云玩家,这并非巧合。”
预计云的所有细分市场都将在2023年实现增长。预计基础设施即服务(IaaS)的最终用户支出在2023年将增长最快,达到30.9%,其次是平台即服务(PaaS),为24.1%(见表1)。
Gartner预测,到2026年,75%的组织将采用以云为基础的数字化转型模型作为基础底层平台。
Nag表示:“IaaS增长的下一阶段将由客户体验、数字和业务成果以及虚拟世界推动。”“聊天机器人和数字孪生等帮助企业与客户更加紧密、实时互动的新兴技术,有赖于云基础设施和平台服务来满足不断增长的计算和存储能力需求。
虽然云基础设施和平台服务的支出增长最快,但是按照最终用户支出计算,SaaS仍然是云市场中最大的一部分。到2023年,SaaS支出预计将增长17.9%,达到1970亿美元。
Nag表示:“巨无霸们在云计算技术基础方面牢牢地占据着主导地位,但是业务应用层的情况则更为分散。”“供应商们正面临着重新设计SaaS产品的需求,以提高生产力、利用云原生功能、嵌入式AI和模块——特别是当预算越来越多地由业务技术人员把控的时候。这一变化将点燃云平台和应用市场的创新和替换浪潮。”
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。