AWS近日宣布全面推出AWS Entity Resolution服务,旨在帮助企业将数据组织成更易于处理的形式。
AWS在纽约举行的AWS Summit峰会上首次公布了这项服务。AWS高官们还在台上介绍了一些现有产品的新功能,这些功能与新的AWS Entity Resolution服务类似,都是为了让企业更轻松地管理和处理他们的数据。

AI驱动的实体解析功能
企业通常有多个记录描述同一对象。例如,某家电子产品零售商可能有一份描述手机功能的文档和一份包含了有关价格和上市信息的文档。尽管关注的是同一主题,但这些记录往往被保存在不同的系统中。
将相关记录链接到单个数据集中可能会很有帮助。单个数据集要比多个不同的文件更容易使用,特别是当这些文件分散在多个系统中时,而且在某些情况下,合并记录可以降低数据存储成本。
这次AWS发布的AWS Entity Resolution服务简化了将相关文件链接在一起的过程,而且该服务比企业经常用于实体解析的定制软件工作流程更易于使用。
用户可以通过可视化的界面与实体解析进行交互。AWS称,用户只需要点击几点下,就可以创建一个软件工作流程来查找相关记录并将其链接起来,还可以手动配置记录链接工作流程或者是使用AWS提供的预配置AI模型实现这个过程的自动化。
AWS应用副总裁Dilip Kumar表示:“如今,有关客户、产品或业务的信息通常是分散的并且保存在各个组织中,只需要点击几下,AWS Entity Resolution就可以让组织轻松匹配不同记录,并且将工作流灵活地、可扩展地、轻松地连接到现有应用。”
简化的AI数据管理
这次AWS峰会的另一个焦点是Amazon OpenSearch Serverless,这项托管搜索引擎和分析服务是在今年1月份推出的,现在已经更新加入了一种矢量引擎,处于预览阶段,将让企业更容易构建AI应用。
AI模型不会以原始格式存储它们摄取的文本、图像和其他文件。相反,模型会把摄取的数据转化为所谓的嵌入,这些是专门的数学结构,比其他类型的数据更容易被神经网络处理。
AWS称,客户可以使用OpenSearch Serverless中新增的矢量引擎来存储他们的AI模型嵌入,而且该引擎可以存储多达数十亿个嵌入。它会在幕后把数据保存在AWS Amazon S3对象存储中,并随着应用需求的变化自动添加或者删除基础设施容量。
AWS公司产品管理高管Pavani Baddepudi和Carl Meadows在博客文章中详细介绍称:“这种矢量引擎通过适应不断变化的工作负载模式和需求来自动调整资源,以提供始终如一的快速性能和规模。随着矢量数量从原型设计期间的几千个增加到生产中的数亿个甚至更多,这种矢量引擎将实现无缝扩展。”
除了存储AI模型的信息外,这种矢量引擎还提供了相似性搜索功能,允许神经网络上传文件并查找已存储在引擎中的类似记录。通常,企业执行该任务需要使用复杂的第三方软件工具。
在数据库中查找相似记录,对很多AI用例来说至关重要。例如,推荐引擎的工作原理就是分析用户购买了哪些产品并显示出类似的商品。AI驱动的网络安全工具则是通过将系统访问请求与已知恶意活动模式进行比较来检测违规行为的。
生成式AI增强
除了OpenSearch Serverless之外,AWS此次还更新了另外两项服务:AWS Glue和Amazon QuickSight,这两项服务增加了生成式AI功能,旨在通过自动执行重复性任务来简化用户的日常工作。
Glue是一种数据集成服务,用于将业务记录转换为更易于分析的形式。工程师们通过编写脚本或者笔记本与Glue进行交互,这些脚本或笔记本定义了如何准备数据以供分析。同时,它集成了AWS的生成式AI编码助手Amazon CodeWhisperer,使工程师能够使用自然语言命令创建这些脚本。
QuickSight也增加了生成式AI增强功能。据AWS称,这项商业智能服务现在允许用户通过在侧边栏中输入自然语言指令将数据转换为图表,分析团队同样可以使用文本提示来自定义图表并对数据进行计算。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。