企业人工智能近期的前景将是模型驱动的,民主化、由代理实现,并面临着越来越大的成本控制压力。
亚马逊云科技(AWS)人工智能和数据副总裁 Swami Sivasubramanian在该公司于拉斯维加斯举办的re:Invent年会上进行了主题演讲,他在演讲中介绍了这些重要的趋势。在他此次演讲之前,AWS于周二进行了一系列发布,确定了这家云计算巨头在企业人工智能和模型使用方面的方向。Sivasubramanian 明确表示,AWS将继续密切关注围绕企业人工智能世界的快速发展动态。
Sivasubramanian表示:“这是具有纪念意义的一年,”“颠覆是新常态。”
今天宣布的消息表明,AWS正在努力跟上人工智能模式应用爆炸式增长的步伐。今年9月,人工智能模型开源中心Hugging Face宣布,其模型库中的模型数量突破100万个,比4月份报告的数量几乎翻了一番。
随着企业人工智能应用的扩大,AWS一直专注于为企业客户提供工具,以管理用于决策和预测的数据驱动模型。周三的新闻包括在Amazon Bedrock中增加了新的模型和供应商,以及Amazon SageMaker在完全托管的基础设施中为任意用例构建和部署机器学习模型的功能。
Sivasubramanian表示:“在模型培训方面,我们目前正面临着一个拐点。”“我们提供多种选择,能够应对任何可以想象得到的任务。”
提示缓存和人工智能代理
Amazon Bedrock还获得了增强功能,旨在帮助企业控制人工智能部署增加带来的成本。AWS 宣布为Bedrock提供新的提示缓存工具,减少重复处理,因为重复处理可能会产生可观的费用。该公司还发布了Intelligent Prompt Routing,它将自动把提示引导到不同的基础模型,并寻求经济实惠的替代方案。
Sivasubramanian表示:“Bedrock会自动将你的提示路由到能以较低成本提供最佳响应的模型。”
Bedrock 的增强功能还凸显了企业对部署和管理人工智能代理的兴趣。Argo Labs等AWS 客户正在将Intelligent Prompt Routing用于餐厅使用的语音代理解决方案。当客人打电话下订单或预订桌位时,聊天机器人可以动态地将查询路由到最合适的模型上进行响应。
Sivasubramanian在re:Invent大会上表示:“代理开启了前所未有的自动化水平。”
在住房抵押贷款领域,人工智能代理的影响也越来越明显。在周三的主题演讲中,金融科技平台 Rocket的首席技术官Shawn Malhotra介绍了其公司如何利用人工智能代理引导客户完成抵押贷款申请流程。他表示,Rocket公司通过人工智能驱动的聊天工具成交客户的可能性比通过人工界面成交客户的可能性高出三倍。
Malhotra曾在Thomson Reuters领导人工智能项目,于今年5月加入Rocket,他描绘了一幅人工智能代理的图景,认为这是改变金融世界的重要一步。Malhotra表示:“拥有一套住房的过程仍然充满了挫折和压力。”“这是一个亟待颠覆的行业。”
机器学习民主化
在本周的re:Invent大会上,人工智能作为颠覆性催化剂的作用一直是一个持续的主题。在会前接受SiliconANGLE独家采访时,Sivasubramanian重点提到了生成式人工智能为非技术用户实现数据民主化的能力,认为这是该技术更重要的成就之一。
这位在云计算巨头AWS工作了19年的高管领导公司开发了用于大规模运行高性能应用程序的DynamoDB数据库,并在为企业打造人工智能和机器学习工具产品方面发挥了重要作用。其中之一就是SageMaker,该产品于2017年在re:Invent大会上推出,是数据、分析和人工智能的统一平台。本周三,Sivasubramanian宣布Amazon Q Developer现在可以在 SageMaker Canvas中使用,使用户能够将机器学习专业知识与业务需求联系起来。
通过自然语言界面,机器学习变得更容易访问,曾经仅限于数据科学家和人工智能专家使用的功能,现在将让非技术用户也能轻松使用。AWS将Q Developer 视为为企业用户实现数据民主化的关键一步。
Sivasubramanian对SiliconANGLE表示:“有了 Q,你可以用自然语言询问见解,并在几分钟内获得面板或数据故事。”“过去需要花费数周时间的任务现在只需几秒钟就能完成。”
好文章,需要你的鼓励
在2025年KubeCon/CloudNativeCon北美大会上,云原生开发社区正努力超越AI炒作,理性应对人工智能带来的风险与机遇。随着开发者和运营人员广泛使用AI工具构建AI驱动的应用功能,平台工程迎来复兴。CNCF推出Kubernetes AI认证合规程序,为AI工作负载在Kubernetes上的部署设定开放标准。会议展示了网络基础设施层优化、AI辅助开发安全性提升以及AI SRE改善可观测性工作流等创新成果。
维吉尼亚理工学院研究团队对58个大语言模型在单细胞生物学领域的应用进行了全面调查,将模型分为基础、文本桥接、空间多模态、表观遗传和智能代理五大类,涵盖细胞注释、轨迹预测、药物反应等八项核心任务。研究基于40多个公开数据集,建立了包含生物学理解、可解释性等十个维度的评估体系,为这个快速发展的交叉领域提供了首个系统性分析框架。
DeepL作为欧洲AI领域的代表企业,正将业务拓展至翻译之外,推出面向企业的AI代理DeepL Agent。CEO库蒂洛夫斯基认为,虽然在日常翻译场景面临更多竞争,但在关键业务级别的企业翻译需求中,DeepL凭借高精度、质量控制和合规性仍具优势。他对欧盟AI法案表示担忧,认为过度监管可能阻碍创新,使欧洲在全球AI竞争中落后。
西湖大学王欢教授团队联合国际研究机构,针对AI推理模型内存消耗过大的问题,开发了RLKV技术框架。该技术通过强化学习识别推理模型中的关键"推理头",实现20-50%的内存缩减同时保持推理性能。研究发现推理头与检索头功能不同,前者负责维持逻辑连贯性。实验验证了技术在多个数学推理和编程任务中的有效性,为推理模型的大规模应用提供了现实可行的解决方案。