Oracle 宣布推出 MySQL HeatWave Lakehouse,让客户能够像在数据库内查询数据一样快地查询对象存储中的数据。MySQL HeatWave Lakehouse支持各种文件格式(例如 CSV、Parquet)和从其他数据库导出的文件,并且可以在同一查询中将对象存储文件数据与 MySQL 数据库中的数据相结合。对象存储中的文件由 HeatWave 直接查询,而无需将数据复制到 MySQL 数据库中。因此,在对象存储中查询数据方面,MySQL HeatWave Lakehouse 为查询处理、数据加载速度、集群预配时间和自动化奠定了新的可扩展性和性能标准。
甲骨文公司首席企业架构师 Edward Screven 表示:“超过 80% 的数据存储在文件系统中,该数字还在不断增长。客户希望将各种外部数据与内部事务处理数据集成和分析,但处理起来往往过于复杂或成本太高。MySQL HeatWave Lakehouse 能够帮助客户将对象存储中的数据与数据库数据结合在一起,让客户能够轻松获得宝贵的实时洞察,同时显著提高查询性能并降低数据加载速度。”
对象存储中的数据查询速度,与数据库中的数据查询速度一样快
如 10 TB TPC-H* 基准测试所示,使用 MySQL HeatWave Lakehouse 以常用文件格式查询对象存储中的数据的速度,与在 MySQL 数据库中查询数据的速度一样快。这是因为 MySQL HeatWave 的内置功能 MySQL Autopilot 提供了基于机器学习的自动化,可以从查询执行中学习,并改进未来查询的执行计划。MySQL Autopilot 是 MySQL HeatWave 一项特别的创新功能。基于 Oracle 云基础设施远程软件服务(Oracle Cloud Infrastructure, OCI)的 MySQL HeatWave 采用 AMD EPYC™ 处理器。
AMD 数据中心解决方案业务小组执行副总裁兼总经理 Forrest Norrod 表示:“AMD 和 MySQL HeatWave 工程团队正在密切合作,合力优化 AMD EPYC 处理器与 MySQL HeatWave 的性能,以利用新的处理器功能。得益于本次合作,在 AMD EPYC CPU 驱动的 OCI 实例上运行 MySQL HeatWave 的 MySQL 客户可在关键业务工作负载方面获得较为突出的性价比,其中包括针对海量对象存储数据的实时分析。”
数据湖仓一体的查询性能十分亮眼
MySQL HeatWave 的性能源自于其横向扩展架构,该架构支持通过大规模并行来配置集群、加载数据和处理高达 512 个节点的查询。此外,MySQL Autopilot 的增强功能可自动为对象文件创建元数据,并动态适应底层对象存储的性能,确保在 OCI 区域中都能提供出色的性能。
MySQL HeatWave 是重要的云端服务,可在单一的 MySQL 数据库服务中提供事务处理、实时分析、机器学习、数据池查询和基于机器学习的自动化功能。作为 Oracle Distributed Cloud 策略的核心,MySQL HeatWave 在 OCI 中提供,在 Amazon Web Services 中原生提供,作为 Oracle Database Service for Azure 的一部分提供,以及通过 OCI Dedicated Region 在客户数据中心内提供。
好文章,需要你的鼓励
在AI智能体的发展中,记忆能力成为区分不同类型的关键因素。专家将AI智能体分为七类:简单反射、基于模型反射、目标导向、效用导向、学习型、多智能体系统和层次化智能体。有状态的智能体具备数据记忆能力,能提供持续上下文,而无状态系统每次都重新开始。未来AI需要实现实时记忆访问,将存储与计算集成在同一位置,从而创造出具备人类般记忆能力的数字孪生系统。
中国人民大学和字节跳动联合提出Pass@k训练方法,通过给AI模型多次答题机会来平衡探索与利用。该方法不仅提升了模型的多样性表现,还意外改善了单次答题准确率。实验显示,经过训练的7B参数模型在某些任务上超越了GPT-4o等大型商业模型,为AI训练方法论贡献了重要洞察。
OpenAI首席执行官阿尔特曼表示,公司计划在不久的将来投入数万亿美元用于AI基础设施建设,包括数据中心建设等。他正在设计新型金融工具来筹集资金。阿尔特曼认为当前AI投资存在过度兴奋现象,类似于90年代互联网泡沫,但AI技术本身是真实且重要的。他承认GPT-5发布存在问题,并表示OpenAI未来可能会上市。
南加州大学等机构研究团队开发出突破性的"N-gram覆盖攻击"方法,仅通过分析AI模型生成的文本内容就能检测其是否记住了训练数据,无需访问模型内部信息。该方法在多个数据集上超越传统方法,效率提升2.6倍。研究还发现新一代AI模型如GPT-4o展现出更强隐私保护能力,为AI隐私审计和版权保护提供了实用工具。