Oracle 宣布将对 MySQL HeatWave 进行革新,包括支持向量存储、生成式 AI、新增数据库内机器学习功能、MySQL Autopilot 增强功能、新增 HeatWave Lakehouse 功能、支持 JavaScript、加速 JSON 查询以及支持新的分析运算符。目前在私有预览中,向量存储支持客户利用大型语言模型 (LLM) 的功能及专有数据,其准确性比仅使用公开数据进行训练的模型更高。通过生成式 AI 和向量存储功能,客户可以使用自然语言与 MySQL HeatWave 交互,并高效地在 HeatWave Lakehouse 中搜索各种格式的文档。
甲骨文公司首席企业架构师 Edward Screven 表示:“此次宣布推出的 MySQL HeatWave 增强功能,是我们在解决客户数据、分析和 AI 等紧迫问题的又一个重要里程碑。我们之前在 HeatWave 中添加了具有高性价比、自动化机器学习、湖仓一体和多云功能的实时分析。现在,向量存储和生成式 AI 为客户带来了强大的 LLM,客户可以用一种直观的方式来与企业中的数据交互,并获得业务所需的准确结果。”
为满足希望对各种数据类型和数据源执行分析、事务处理、机器学习和生成性 AI 的客户,MySQL HeatWave 中增加了额外的功能,适用于与 MySQL 兼容的工作负载和非 MySQL 工作负载。
生成式 AI 和向量存储(私有预览)
向量存储以各种格式(如 PDF)摄取文档,并将其存储为通过编码器模型生成的嵌入。对于给定的用户查询,向量存储将对所存储的嵌入和嵌入式查询执行相似性搜索,识别相似度高的文档,然后这些文档将用于增强给 LLM 的提示,使其能够提供更符合情境的答案。
MySQL HeatWave AutoML
MySQL HeatWave 所提供的数据库内机器学习包含全自动化的训练模型管道。客户无需将数据迁移到单独的机器学习服务中,即可轻松、安全地将存储在 MySQL HeatWave 中的数据用于机器学习训练、推断和解释。具体新增功能如下:
MySQL Autopilot
MySQL Autopilot 是 MySQL HeatWave 的内置功能,使用机器学习驱动的自动化来提高性能和可扩展性,并且无需具备数据库调优的专业知识即可操作。该功能将学习如何执行查询,以改进未来查询的执行计划。MySQL Autopilot 新的增强功能包括:
其他 MySQL HeatWave 增强功能
NAND Research 首席分析师兼创始合伙人 Steve McDowell 表示:“MySQL HeatWave 工程团队显然正在加大 AI 和机器学习的创新力度。现在,客户不仅能够以全面自动化的方式,使用数据库和对象存储中的数据进行机器学习模型训练,还可以借助全新的 AI 和向量存储功能,以自然语言与 HeatWave 进行交互。相关的模型训练除了使用公开提供的数据外,也使用了企业自己的数据,让客户能够获得精准符合业务目的的答案。客户可以自由选择 LLM,而这一点凸显了 MySQL HeatWave 工程团队的开放式协作策略。”
MySQL HeatWave 可在一个 MySQL 数据库服务中提供事务处理、实时分析、机器学习、数据池查询和基于机器学习的自动化功能。作为 Oracle Distributed Cloud 策略的核心,MySQL HeatWave 在 OCI 和 Amazon Web Services 中原生提供,作为 Oracle Database Service for Azure 的一部分提供,以及通过 OCI Dedicated Region 在客户数据中心内提供。
好文章,需要你的鼓励
OpenAI CEO描绘了AI温和变革人类生活的愿景,但现实可能更复杂。AI发展将带来真正收益,但也会造成社会错位。随着AI系统日益影响知识获取和信念形成,共同认知基础面临分裂风险。个性化算法加剧信息茧房,民主对话变得困难。我们需要学会在认知群岛化的新地形中智慧生存,建立基于共同责任而非意识形态纯洁性的社区。
杜克大学等机构研究团队通过三种互补方法分析了大语言模型推理过程,发现存在"思维锚点"现象——某些关键句子对整个推理过程具有决定性影响。研究表明,计划生成和错误检查等高层次句子比具体计算步骤更重要,推理模型还进化出专门的注意力机制来跟踪这些关键节点。该发现为AI可解释性和安全性研究提供了新工具和视角。
传统数据中心基础设施虽然对企业至关重要,但也是预算和房地产的重大负担。模块化数据中心正成为强有力的替代方案,解决企业面临的运营、财务和环境复杂性问题。这种模块化方法在印度日益流行,有助于解决环境问题、满足人工智能的电力需求、降低成本并支持新一代分布式应用。相比传统建设需要数年时间,工厂预制的模块化数据中心基础设施可在数周内部署完成。
法国索邦大学团队开发出智能医学文献管理系统Biomed-Enriched,通过AI自动从PubMed数据库中识别和提取高质量临床案例及教育内容。该系统采用两步注释策略,先用大型AI模型评估40万段落质量,再训练小型模型处理全库1.33亿段落。实验显示该方法仅用三分之一训练数据即可达到传统方法效果,为医学AI发展提供了高效可持续的解决方案。