企业人工智能近期的前景将是模型驱动的,民主化、由代理实现,并面临着越来越大的成本控制压力。
亚马逊云科技(AWS)人工智能和数据副总裁 Swami Sivasubramanian在该公司于拉斯维加斯举办的re:Invent年会上进行了主题演讲,他在演讲中介绍了这些重要的趋势。在他此次演讲之前,AWS于周二进行了一系列发布,确定了这家云计算巨头在企业人工智能和模型使用方面的方向。Sivasubramanian 明确表示,AWS将继续密切关注围绕企业人工智能世界的快速发展动态。
Sivasubramanian表示:“这是具有纪念意义的一年,”“颠覆是新常态。”
今天宣布的消息表明,AWS正在努力跟上人工智能模式应用爆炸式增长的步伐。今年9月,人工智能模型开源中心Hugging Face宣布,其模型库中的模型数量突破100万个,比4月份报告的数量几乎翻了一番。
随着企业人工智能应用的扩大,AWS一直专注于为企业客户提供工具,以管理用于决策和预测的数据驱动模型。周三的新闻包括在Amazon Bedrock中增加了新的模型和供应商,以及Amazon SageMaker在完全托管的基础设施中为任意用例构建和部署机器学习模型的功能。
Sivasubramanian表示:“在模型培训方面,我们目前正面临着一个拐点。”“我们提供多种选择,能够应对任何可以想象得到的任务。”
提示缓存和人工智能代理
Amazon Bedrock还获得了增强功能,旨在帮助企业控制人工智能部署增加带来的成本。AWS 宣布为Bedrock提供新的提示缓存工具,减少重复处理,因为重复处理可能会产生可观的费用。该公司还发布了Intelligent Prompt Routing,它将自动把提示引导到不同的基础模型,并寻求经济实惠的替代方案。
Sivasubramanian表示:“Bedrock会自动将你的提示路由到能以较低成本提供最佳响应的模型。”
Bedrock 的增强功能还凸显了企业对部署和管理人工智能代理的兴趣。Argo Labs等AWS 客户正在将Intelligent Prompt Routing用于餐厅使用的语音代理解决方案。当客人打电话下订单或预订桌位时,聊天机器人可以动态地将查询路由到最合适的模型上进行响应。
Sivasubramanian在re:Invent大会上表示:“代理开启了前所未有的自动化水平。”
在住房抵押贷款领域,人工智能代理的影响也越来越明显。在周三的主题演讲中,金融科技平台 Rocket的首席技术官Shawn Malhotra介绍了其公司如何利用人工智能代理引导客户完成抵押贷款申请流程。他表示,Rocket公司通过人工智能驱动的聊天工具成交客户的可能性比通过人工界面成交客户的可能性高出三倍。
Malhotra曾在Thomson Reuters领导人工智能项目,于今年5月加入Rocket,他描绘了一幅人工智能代理的图景,认为这是改变金融世界的重要一步。Malhotra表示:“拥有一套住房的过程仍然充满了挫折和压力。”“这是一个亟待颠覆的行业。”
机器学习民主化
在本周的re:Invent大会上,人工智能作为颠覆性催化剂的作用一直是一个持续的主题。在会前接受SiliconANGLE独家采访时,Sivasubramanian重点提到了生成式人工智能为非技术用户实现数据民主化的能力,认为这是该技术更重要的成就之一。
这位在云计算巨头AWS工作了19年的高管领导公司开发了用于大规模运行高性能应用程序的DynamoDB数据库,并在为企业打造人工智能和机器学习工具产品方面发挥了重要作用。其中之一就是SageMaker,该产品于2017年在re:Invent大会上推出,是数据、分析和人工智能的统一平台。本周三,Sivasubramanian宣布Amazon Q Developer现在可以在 SageMaker Canvas中使用,使用户能够将机器学习专业知识与业务需求联系起来。
通过自然语言界面,机器学习变得更容易访问,曾经仅限于数据科学家和人工智能专家使用的功能,现在将让非技术用户也能轻松使用。AWS将Q Developer 视为为企业用户实现数据民主化的关键一步。
Sivasubramanian对SiliconANGLE表示:“有了 Q,你可以用自然语言询问见解,并在几分钟内获得面板或数据故事。”“过去需要花费数周时间的任务现在只需几秒钟就能完成。”
好文章,需要你的鼓励
邻里社交应用Nextdoor推出重新设计版本,新增本地新闻、实时警报和名为"Faves"的AI功能,用于发现本地商户和地点。该应用与3500家本地出版商合作提供新闻内容,通过Samdesk和Weather.com提供天气、交通、停电等实时警报。Faves功能利用15年邻里对话数据训练的大语言模型,为用户提供本地化AI推荐服务,帮助用户找到最佳餐厅、徒步地点等本地信息。
Skywork AI推出的第二代多模态推理模型R1V2,通过创新的混合强化学习方法,成功解决了AI"慢思考"策略在视觉推理中的挑战。该模型在保持强大推理能力的同时有效控制视觉幻觉,在多项权威测试中超越同类开源模型,某些指标甚至媲美商业产品,为开源AI发展树立了新标杆。
英国生物银行完成了世界上最大规模的全身成像项目,收集了10万名志愿者的超过10亿次扫描数据,用于研究人体衰老和疾病过程。该项目历时11年,每次扫描耗时5小时,投资6200万英镑。目前已有8万人的成像数据供全球研究人员使用,剩余数据将于年底前发布。项目已开发出能预测38种常见疾病的AI工具,并在心脏病、痴呆症和癌症诊断方面取得突破。
这项由北京大学等多所高校联合完成的研究,首次对OpenAI GPT-4o的图像生成能力进行了全面评估。研究团队设计了名为GPT-ImgEval的综合测试体系,从文本转图像、图像编辑和知识驱动创作三个维度评估GPT-4o,发现其在所有测试中都显著超越现有方法。研究还通过技术分析推断GPT-4o采用了自回归与扩散相结合的混合架构,并发现其生成图像仍可被现有检测工具有效识别,为AI图像生成领域提供了重要的评估基准和技术洞察。