AWS近日宣布全面推出AWS Entity Resolution服务,旨在帮助企业将数据组织成更易于处理的形式。
AWS在纽约举行的AWS Summit峰会上首次公布了这项服务。AWS高官们还在台上介绍了一些现有产品的新功能,这些功能与新的AWS Entity Resolution服务类似,都是为了让企业更轻松地管理和处理他们的数据。
AI驱动的实体解析功能
企业通常有多个记录描述同一对象。例如,某家电子产品零售商可能有一份描述手机功能的文档和一份包含了有关价格和上市信息的文档。尽管关注的是同一主题,但这些记录往往被保存在不同的系统中。
将相关记录链接到单个数据集中可能会很有帮助。单个数据集要比多个不同的文件更容易使用,特别是当这些文件分散在多个系统中时,而且在某些情况下,合并记录可以降低数据存储成本。
这次AWS发布的AWS Entity Resolution服务简化了将相关文件链接在一起的过程,而且该服务比企业经常用于实体解析的定制软件工作流程更易于使用。
用户可以通过可视化的界面与实体解析进行交互。AWS称,用户只需要点击几点下,就可以创建一个软件工作流程来查找相关记录并将其链接起来,还可以手动配置记录链接工作流程或者是使用AWS提供的预配置AI模型实现这个过程的自动化。
AWS应用副总裁Dilip Kumar表示:“如今,有关客户、产品或业务的信息通常是分散的并且保存在各个组织中,只需要点击几下,AWS Entity Resolution就可以让组织轻松匹配不同记录,并且将工作流灵活地、可扩展地、轻松地连接到现有应用。”
简化的AI数据管理
这次AWS峰会的另一个焦点是Amazon OpenSearch Serverless,这项托管搜索引擎和分析服务是在今年1月份推出的,现在已经更新加入了一种矢量引擎,处于预览阶段,将让企业更容易构建AI应用。
AI模型不会以原始格式存储它们摄取的文本、图像和其他文件。相反,模型会把摄取的数据转化为所谓的嵌入,这些是专门的数学结构,比其他类型的数据更容易被神经网络处理。
AWS称,客户可以使用OpenSearch Serverless中新增的矢量引擎来存储他们的AI模型嵌入,而且该引擎可以存储多达数十亿个嵌入。它会在幕后把数据保存在AWS Amazon S3对象存储中,并随着应用需求的变化自动添加或者删除基础设施容量。
AWS公司产品管理高管Pavani Baddepudi和Carl Meadows在博客文章中详细介绍称:“这种矢量引擎通过适应不断变化的工作负载模式和需求来自动调整资源,以提供始终如一的快速性能和规模。随着矢量数量从原型设计期间的几千个增加到生产中的数亿个甚至更多,这种矢量引擎将实现无缝扩展。”
除了存储AI模型的信息外,这种矢量引擎还提供了相似性搜索功能,允许神经网络上传文件并查找已存储在引擎中的类似记录。通常,企业执行该任务需要使用复杂的第三方软件工具。
在数据库中查找相似记录,对很多AI用例来说至关重要。例如,推荐引擎的工作原理就是分析用户购买了哪些产品并显示出类似的商品。AI驱动的网络安全工具则是通过将系统访问请求与已知恶意活动模式进行比较来检测违规行为的。
生成式AI增强
除了OpenSearch Serverless之外,AWS此次还更新了另外两项服务:AWS Glue和Amazon QuickSight,这两项服务增加了生成式AI功能,旨在通过自动执行重复性任务来简化用户的日常工作。
Glue是一种数据集成服务,用于将业务记录转换为更易于分析的形式。工程师们通过编写脚本或者笔记本与Glue进行交互,这些脚本或笔记本定义了如何准备数据以供分析。同时,它集成了AWS的生成式AI编码助手Amazon CodeWhisperer,使工程师能够使用自然语言命令创建这些脚本。
QuickSight也增加了生成式AI增强功能。据AWS称,这项商业智能服务现在允许用户通过在侧边栏中输入自然语言指令将数据转换为图表,分析团队同样可以使用文本提示来自定义图表并对数据进行计算。
好文章,需要你的鼓励
CoreWeave发布AI对象存储服务,采用本地对象传输加速器(LOTA)技术,可在全球范围内高速传输对象数据,无出口费用或请求交易分层费用。该技术通过智能代理在每个GPU节点上加速数据传输,提供高达每GPU 7 GBps的吞吐量,可扩展至数十万个GPU。服务采用三层自动定价模式,为客户的AI工作负载降低超过75%的存储成本。
IDEA研究院等机构联合开发了ToG-3智能推理系统,通过多智能体协作和双重进化机制,让AI能像人类专家团队一样动态思考和学习。该系统在复杂推理任务上表现优异,能用较小模型达到卓越性能,为AI技术的普及应用开辟了新路径,在教育、医疗、商业决策等领域具有广阔应用前景。
谷歌DeepMind与核聚变初创公司CFS合作,运用先进AI模型帮助管理和改进即将发布的Sparc反应堆。DeepMind开发了名为Torax的专用软件来模拟等离子体,结合强化学习等AI技术寻找最佳核聚变控制方式。核聚变被视为清洁能源的圣杯,可提供几乎无限的零碳排放能源。谷歌已投资CFS并承诺购买其200兆瓦电力。
上海人工智能实验室提出SPARK框架,创新性地让AI模型在学习推理的同时学会自我评判,通过回收训练数据建立策略与奖励的协同进化机制。实验显示,该方法在数学推理、奖励评判和通用能力上分别提升9.7%、12.1%和1.5%,且训练成本仅为传统方法的一半,展现出强大的泛化能力和自我反思能力。