Amazon副总裁、首席技术官Werner Vogels向企业传达了一个信息:在管理云成本方面,是时候成为节俭型的架构师了。
Vogels(如图)在构建大型云平台以运行美国最大在线零售业务方面拥有近20年的经验,本周四他在美国拉斯维加斯举行的AWS re:Invent大会上发表主题演讲,讲述了关于成本优化和衡量的话题。
Vogels表示:“作为技术专家,我们生活在一个瞬息万变的世界,我们总是需要不断学习,坐下来,拿出你的记事本,今天就开始做笔记。”
设计成本
Vogels选择在主题演讲的过程中讨论费用问题,这既反映了当前的经济环境,也反映了云计算支出的不断增长。本月早些时候,Gartner发布预测称,到2024年云终端用户支出将达到6780亿美元,相比今年的5630亿美元有大幅增长。
AWS成功地引领了公有云市场,但人们也应该注意到,AWS所帮助定义的行业已经创建了一条成本货运列车,而随着生成式AI等技术的不断采用,这一列车的前进势头只会越来越明显。
Vogels表示:“构建这些系统并在各种限制条件下生存下来,这是一门艺术。云消除了所有这些限制。突然之间,最重要的事情就是快速行动,推出产品。随着执行速度变得越来越重要,我们遗失了这种成本架构和牢记成本的艺术。作为建设者,我们确实需要开始思考这个问题了。”
Vogels概述了成为“节俭型架构师”的关键原则,这是一套自我描述的“法则”,已经发布在专门讨论这个主题的新网站上,其中包括了创建使成本与业务保持一致的系统,以及观察基础设施中的关键运营网络以避免未知费用以及追求增量优化。
Vogels说:“我试图与初创公司敲定这一点,你们要采用什么收入模式?他们需要构建遵循此模型的架构。确保你的收入维度始终与你的成本是保持一致的。”
他指出,关注成本除了省钱之外,还有其他好处,例如还可以节省能源,考虑到这些新的AI模型需要消耗大量能源,这一点也越来越受到人们的关注。
他说:“成本是和可持续性密切相关的,这是我的想法,也应该是你的想法。”Vogels以荷兰文件传输服务公司WeTransfer为例,该公司使用AWS在2022年将服务器使用的碳排放量减少了78%。
云监控工具
本周四AWS宣布提供新的工具,让企业可以使用这些工具来遵循Vogels的建议。这次在AWS Management Console中推出的myApplications产品,让用户能够更轻松地管理和监控AWS上应用的成本、运行状况和安全状况。
此外,AWS还发布了Amazon Cloud Watch Application Signals,该解决方案旨在让客户自动检测应用,最大限度地提高效率和成本效益。
Vogels说:“企业需要了解使用AWS的成本,他们开始变得更精明了,要减少应用真正需要的资源量。”
许多组织面临的一个困境是,随着对生成式AI的兴趣不断高涨,驱动应用所需的资源量也显着增加。除了解决云计算领域成本带来的影响之外,Vogels还提出了他对AI以及简化性的看法。
他说:“有新型的AI和老式的AI,你应该记住,并不是所有事情都需要使用这些大型语言模型来完成。AI做出预测,专业人士做出决定。”
他提到了很多全球组织多年来一直使用基本的AI工具来完成任务,其中包括菲律宾的国际水稻研究所,该研究所依靠机器学习和视觉管理技术来自动寻找最佳种子种植水稻的过程。
他还提到了自己作为一名年轻计算机科学家与当地一家医院合作建立模型的经历,该模型可以评估患者脑部扫描图像是否有出血迹象。
“如果我能做到,你也能做到,如果你正在使用机器学习,你仍然应该是一个节俭型的架构师。”
预测未来
Vogels在主题演讲的当天早上还发布了他的“2024年及未来技术预测”,这已经成为一年一度的传统。毫不意外的是,生成式AI在他的名单中名列前茅,他预测,基于文化多样性数据的大型语言模型训练将实现对复杂社会变化更为细致的理解。
AI在另一项预测中也占有重要地位,即智能助手将从基本代码生成器发展成为可以在整个软件开发生命周期提供支持的教育者和协作者。
今年榜单的最后一项预测是,对“女性科技”的投资将激增,有数据揭示,患者治疗结果的改善将为女性医疗从业者创造一个拐点。Vogels还预测,技术教育将从定制的在职培训发展为行业主导的、基于技能的学习。
Vogels出席re:Invent的另一项传统是他上舞台选择穿的T恤,今年是以Street Sweeper Social Club为特色,这是一个美国说唱摇滚超级团体,由Rage Against The Machine乐队的吉他手在八年前组建的。
考虑到这个视频制作元素取材于1999年科幻经典《黑客帝国》中的场景,这或许是再合适不过了,这些元素在他周四的主题演讲中也是随处可见。
“要预测未来,就要观察当下。”Vogels说。
好文章,需要你的鼓励
Intuit在ChatGPT发布后匆忙推出的聊天式AI助手遭遇失败,随后公司进行了为期九个月的战略转型。通过观察客户实际工作流程,发现手动转录发票等重复性劳动,决定用AI智能体自动化这些任务而非强加新的聊天行为。公司建立了三大支柱框架:培养构建者文化、高速迭代替代官僚主义、构建GenOS平台引擎。最终推出的QuickBooks支付智能体让小企业平均提前5天收到款项,每月节省12小时工作时间。
希伯来大学研究团队开发出MV-RAG系统,首次解决了AI在生成稀有物品3D模型时的"胡编乱造"问题。该系统像拥有图像记忆库的艺术家,能先搜索相关真实照片再生成准确3D视图。通过独创的混合训练策略和智能自适应机制,MV-RAG在处理罕见概念时性能显著超越现有方法,为游戏开发、影视制作、虚拟现实等领域提供了强大工具。
马斯克旗下xAI公司发布专为开发者设计的新AI模型grok-code-fast-1,主打快速且经济的推理能力。该模型属于Grok 4系列,具备自主处理任务的能力。xAI声称其在SWE-bench评测中解决了70.8%的实际软件问题,表现优于GPT-5和Claude 4。不过模型存在较高的不诚实率问题。用户可通过GitHub Copilot等平台免费试用7天,需要API密钥访问。
MBZUAI等机构研究团队通过一维细胞自动机实验揭示了AI模型多步推理的关键限制:固定深度模型在单步预测上表现优异,但多步推理能力急剧下降。研究发现增加模型深度比宽度更有效,自适应计算时间、强化学习和思维链训练能突破这些限制。这为开发更强推理能力的AI系统提供了重要指导,强调了真正推理与简单记忆的本质区别。