在更新了一系列云数据库服务仅一周后,Google Cloud又推出了更多以数据为中心的更新,重点是帮助企业构建可以代表用户执行任务的AI代理。
Google Cloud总经理、数据分析副总裁Gerrit Kazmaier还透露了其他各种功能,包括对开放数据表格式的支持、扩展的矢量搜索功能、更多治理控制和BigQuery中的语义搜索体验。
Gemini驱动的数据代理
为了简化构建AI代理的过程,Google推出了一系列新的对话式应用编程接口,旨在与Gemini大型语言模型配合使用,以创建不仅能完美理解用户意图、还能执行任何要求的聊天机器人。
Looker和AI工程副总裁Peter Bailis在简报会上展示了由其对话式API驱动的新型咖啡店AI代理,并解释说,用户可以询问有关最畅销饮品的简单问题,并立即得到答复。然后,用户可以提出更复杂的后续问题,例如“首次访客的平均销售额是多少?”并立即得到答复。
Bailis说,它的功能还扩展到可以进行预测。例如,咖啡店经理可以询问它未来30天的总销售额预测是多少,它将根据现有数据自动运行预测以生成响应。
关键是,它结合了谷歌分析工具(例如Looker)和基于私有企业数据的Gemini模型的强大功能。Kazmaier说:“这就是它成为代理的原因,它不止是检索现有信息,就好像你在和数据分析师聊天一样,这就是突破之处。”
Bailis说,未来将在BigQuery中创建一个数据准备代理,来完成所有耗时的数据准备工作。在咖啡店的例子中,它就可以把最相关的数据组织到一个新表格文件中,文件针对特定搜索进行了优化,例如有关咖啡销售的问题。
“它基本上消除了所有这些数据以及如何在其中找到我想要的东西这个最大痛点,”Bailis补充说。
Google表示,内部已经使用这些API在Looker中构建了对话式语义搜索体验,将Gemini的功能与前者的企业级语义层进行了结合。
BigQuery中的扩展数据访问
这次的企业更新大多与BigQuery有关,BigQuery是Google Cloud旗舰的无服务器云数据仓库,可作为数据分析工作负载的中心。Kazmaier表示,它将获得一系列新功能,包括它的托管体验将让Iceberg、Hudi和Delta文件格式用户变得更轻松,这些文件格式是开源的标准表格格式,可用于高效处理非常大的数据集。除此之外,这些数据源还获得了对BigQuery中多模式数据类型的支持,包括来自文档理解、视觉AI和文本转语音处理等AI应用的信息。
至于新的语义搜索工具,主要针对那些希望使用BigQuery中的数据来支持基于Vertex AI平台构建的AI应用客户。Vertex AI平台是Google主要的AI应用开发工具。
Kazmaier表示,在最近的一次更新中,BigQuery增加了对检索增强生成技术和向量嵌入的支持,使AI应用能够直接对其存储的非结构化数据进行推理。当时,Google还公布了和LangChain的集成,以简化对数据进行预处理的工作,以便将其转换为向量嵌入。
Kazmaier表示,基于这些更新,BigQuery现在还通过支持ScaNN向量索引增强了向量搜索功能——一种通过将非结构化数据(例如视频)表示为向量嵌入来使其可搜索的工具。ScaNN是支持Google搜索本身视频和图像搜索所使用的同一项技术,现在增加了对YouTube搜索引擎的支持。
增强的数据搜索、保护和治理
谈到数据治理,Kazmaier表示,Google正在实施各种新功能,旨在帮助企业让AI能够访问其最敏感的信息而不会危及到这些信息。
首先,它让客户可以更容易地通过BigQuery DataFrames使用熟悉的Python应用编程接口处理数据。用户借助DataFrames就可以根据专有数据集轻松生成数据,使用这些数据来代替真正高度敏感的信息来训练AI。
其次,Google宣布BigQuery统一目录正式推出,这种数据发现工具的工作原理是自动从企业整个数据资产(包括AI模型、商业智能工具和数据库)中提取、收集和索引元数据。要查询这些资产,用户可以利用现在处于预览状态的新BigQuery目录语义搜索功能。
这样就可以用自然语言询问有关数据的问题。Kazmaier表示,BigQuery将理解用户的意图并检索最相关的结果,从而让他们更容易找到自己想要的内容。
第三,BigQuery的元存储功能进一步降低了数据复杂性,使多个引擎能够运行在分布于结构化和非结构化对象数据表中的单个数据副本上,为政策执行和绩效管理提供了单一的数据平面。
第四,BigQuery获得了新的治理工具,专门针对把这项服务与Google主要的商业智能工具Looker结合使用的用户。它提供的是一种完全托管的自助服务体验,用于连接和提取Looker中的元数据,而无需维护数据连接器。
最后,BigQuery新增了加密和灾难恢复功能,确保客户拥有足够的故障转移和冗余计算能力来处理他们最关键的工作负载。
好文章,需要你的鼓励
诺基亚最新全球网络流量报告预测,到2034年WAN流量将增长300%至700%,主要驱动力包括人工智能、工业运营扩展和消费者沉浸式应用。报告称AI流量年复合增长率将达23%,到2034年占全球WAN流量30%。然而专家对此预测提出质疑,认为报告缺乏具体应用场景支撑。分析师指出,企业目前并未因WAN带宽限制而无法实现目标,工业设备更新周期长达15年以上,大规模流量增长不太可能快速实现。
GigaAI团队开发的GigaBrain-0.5M*系统首次让机器人获得了"预见未来"的能力,通过世界模型预测未来场景并指导行动决策。该系统采用RAMP强化学习方法,在多项复杂操作任务中表现优异,成功率比传统方法提升约30%,并在国际RoboChallenge基准测试中排名第一,代表了从反应式控制向前瞻式智能的重大突破。
今天的出海故事,从一笔690.78万加元的少数股权投资开始:金牌家居的全资子公司与关联方通过新加坡主体共同参投 RIFO Holding Group Inc.,简称RIFO,先把钱放到加拿大“住房交易、金融服务与安居服务”这条链条更靠前的位置。
这项由人大和腾讯联合开展的研究提出了ExOPD方法,通过调节奖励信号让AI学生模型突破老师性能限制。研究在数学推理和代码生成任务上验证了该方法的有效性,发现合适的奖励外推能让小模型超越大模型表现。该技术为AI训练领域带来新思路,但仍需考虑计算成本等实际限制。