随着人工智能 (AI) 创新产品涌入市场,我们经常听到客户在了解专业术语、学习新工具甚至是将数据迁移到 AI 工具的位置方面面临着种种挑战。这就是为什么 Oracle 决定将 AI 嵌入到全栈(包括数据库)中,让您无需迁移数据即可获取 AI 的力量。
为此,我们将推出多个 Oracle自治数据库(Oracle Autonomous Database)增强功能,包括将 AI 和高级机器学习 (ML) 集成到应用中等创新。这些直观且易于使用的增强功能包括:
• Autonomous Database Select AI 现在支持开发人员创建 AI 应用,可在会话线程中理解用户用自然语言提出的问题,并从专用数据中获取答案。
• Oracle Machine Learning 中的空间增强功能支持企业在 ML 模型中包含位置关系,从而提高模型准确性。
• 全新用户友好的“无代码”模型监视界面可简化 ML 模型中质量和概念漂移的及时检测。
• 通过 Autonomous Database Graph Studio 新的用户界面,企业可以通过拖放方式创建资源描述框架 (Resource Description Framework, RDF) 知识图的属性图形视图,无需进行复杂的编码或数据复制,即可跨知识孤岛进行探索。
这些自治数据库增强功能反映了 Oracle 一直致力于为您提供将 AI 和 ML 集成到应用中的工具,从而帮助您快速从数据中获得洞察并及时做出业务决策。这些新创新都直接内置在 自治数据库中,让企业可以轻松地立即使用。
与数据对话
Select AI 是去年 9 月发布的一项突破性功能,支持您使用自然语言通过 Autonomous Database 分析数据(详见能够“说话”的自治数据库)。Select AI 的主要优势之一是,您无需了解数据的存储位置或掌握如何编写 SQL 查询,就可以提出业务问题。该功能支持SQL 应用访问,并且作为自治数据库中的集成功能提供,让您可以立即使用。现在,Select AI 提供更好的对话支持。
以前使用 Select AI 时,用户可以通过自然语言使用大型语言模型 (LLM) 来提出有关数据的问题(例如“今年我的总销售额是多少?”)。但是,当时的功能无法记住之前的问题并基于这些问题进一步跟进。现在,Select AI 使 LLM 可以访问聊天历史记录,进而解释跟进问题的情境。用户现在可以与数据库进行“对话”,以探索所需的答案并缩小范畴,就像在现实生活中进行讨论一样。此外,为了确保完全透明并验证结果,您现在可以要求 Select AI 产出生成的 SQL 和查询处理说明:
重要的是,Select AI 的优势在于用户能够以较少的工作量直观地使用 AI 增强应用。相较于使用定制编码和专有接口来尝试将 AI 与应用集成,Oracle 选择专注于让开发人员和组织尽可能直观地采用企业生成式 AI。
IDC 数据管理软件研究副总裁 Carl Olofson?表示:“AI 的存在离不开数据。当然,Oracle 让您能够以对话的方式访问大型语言模型 (LLM) 从互联网中捕获的常用文本数据,但这只是筹码之一。每个人都这样做。比较难的是如何将这种功能扩展到数据库中的结构化数据,这些数据没有定义,没有语义,但又必须要指定或推断。而 Oracle 在这方面有着明显的优势,因为 Oracle 数据库中存储了数 PB 的数据。自治数据库为用户提供了企业视图来查看组织数据,而 Select AI 则提供了具有广泛 SQL 转换和生成功能的自然语言界面,让您可以通过这个差异化组合,将数据交互提升到新的水平。为了使其更具吸引力,此功能被封装在 Oracle 的全栈 AI 方法中,让客户动动手指就可以获得各种结构化和非结构化信息。”
与 OCI Generative AI 紧密集成的 Select AI
Oracle 近期宣布,Select AI 将支持 OCI Generative AI。Oracle 正式推出对 OCI Generative AI 的支持。您可以将自治数据库中的私有企业数据与生成式 AI 的生产力和创造力安全地结合起来,从而加快应用开发或创建新的业务解决方案。使用 OCI Generative AI 和 Select AI 有助于确保数据安全,确保数据不会离开Oracle 云基础设施远程软件服务( Oracle Cloud Infrastructure, OCI),不会与 AI 提供商共享,并受到 Oracle 数据库高级功能的保护。查看公告或观看网播(概览 | 面向开发人员的详情),了解如何提供富有吸引力的 AI 驱动解决方案。
利用情境强化分析
将语义应用于数据和数据关系是非常有价值的;AL 和 ML 算法可以使用这些语义来生成更吸引人和更可靠的结果。这两个重要的自治数据库增强功能可帮助您充分利用业务情境:分析知识图定义的关系和连接,以及使用地理位置构建更有效的 ML 模型。
轻松分析知识图定义的关系
RDF 知识图可捕获机构数据孤岛之间的复杂关联,为数据关系赋予意义。企业可以从知识图的数据中获得额外的洞察,但如果不复制数据或进行复杂的编程,要做到这一点并不容易。现在,您可以通过属性图形视图将自治数据库内置的图形分析(例如路径查找、中心性和异常检测算法)应用于知识图,从而轻松发现隐藏的关系。您可以在 Graph Studio 中使用新的无代码用户界面,轻松设置属性图形模型。
利用位置信息,改善机器学习
地理位置可以成为各种预测分析的重要信息。Oracle Machine Learning for Python (OML4Py) 新的增强功能可帮助开发人员和数据科学家创建 ML 模型并结合位置关系,同时利用 Oracle Spatial 对空间数据类型、索引和分析的原生支持。数据科学家可以通过定量方法(例如空间聚类、回归、分类和异常检测)来检测空间模式,无需将数据移出数据库或自行编写复杂的算法。
通过“无代码”模型监视,确保 ML 解决方案高效且符合目标
现实世界的 ML 部署面临着现实世界的挑战:欺诈者不断在调整行为,客户的购买模式发生变化,微观经济或宏观经济变化可能会影响整个市场。MLOps 员工必须不断关注“模型漂移”,也就是当他们的 ML 模型的准确性因各种外部因素而开始下降的时候。新的模型监视 UI 可帮助专家和非专家 MLOps 员工无需进行复杂的编码,只需点击几下即可监视 ML 模型的有效性,从而在需要时快速调整 ML 模型。
这一切都归功于数据
如果没有数据,AI 和 Ml 就不可能存在。AI 和 ML 的结果只会与其操作的数据一样有效。自治数据库提供集成的数据资产视图,可大幅简化分析应用。其内置功能让您可以访问来自 100 多个应用、数据湖和数据库的数据,并为分析做好准备。借助自治数据库,您可以充分利用数据湖目录(例如 Oracle OCI Data Catalog 和 Amazon Glue),并立即访问数据以进行分析,而无需进行管理。
Oracle 自治数据库提供统一的数据视图
总结
AI 和 ML 技术正以惊人的速度发展。自治数据库可帮助您的企业克服数据复杂性、数据隐私、组织技能集和运营分析等重重挑战。现在正是利用 AI 和 ML 进行创新的大好时机,切勿错过。
好文章,需要你的鼓励
zip2zip是一项创新技术,通过引入动态自适应词汇表,让大语言模型在推理时能够自动组合常用词组,显著提高处理效率。由EPFL等机构研究团队开发的这一方法,基于LZW压缩算法,允许模型即时创建和使用"超级tokens",将输入和输出序列长度减少20-60%,大幅提升推理速度。实验表明,现有模型只需10个GPU小时的微调即可适配此框架,在保持基本性能的同时显著降低计算成本和响应时间,特别适用于专业领域和多语言场景。
这项研究创新性地利用大语言模型(LLM)代替人类标注者,创建了PARADEHATE数据集,用于仇恨言论的无毒化转换。研究团队首先验证LLM在无毒化任务中表现可与人类媲美,随后构建了包含8000多对仇恨/非仇恨文本的平行数据集。评估显示,在PARADEHATE上微调的模型如BART在风格准确性、内容保留和流畅性方面表现优异,证明LLM生成的数据可作为人工标注的高效替代方案,为创建更安全、更具包容性的在线环境提供了新途径。
这项研究由中国科学技术大学的研究团队提出了Pro3D-Editor,一种新型3D编辑框架,通过"渐进式视角"范式解决了现有3D编辑方法中的视角不一致问题。传统方法要么随机选择视角迭代编辑,要么同时编辑多个固定视角,都忽视了不同编辑任务对应不同的"编辑显著性视角"。Pro3D-Editor包含三个核心模块:主视角采样器自动选择最适合编辑的视角,关键视角渲染器通过创新的MoVE-LoRA技术将编辑信息传递到其他视角,全视角精修器修复并优化最终3D模型。实验证明该方法在编辑质量和准确性方面显著优于现有技术。
这项研究提出了ComposeAnything,一个无需重新训练的框架,可显著提升AI图像生成模型处理复杂空间关系的能力。该技术由INRIA、巴黎高师和CNRS的研究团队开发,通过三个创新步骤工作:首先利用大型语言模型创建包含深度信息的2.5D语义布局,然后生成粗略的场景合成图作为先验指导,最后通过物体先验强化和空间控制去噪引导扩散过程。在T2I-CompBench和NSR-1K基准测试中,该方法远超现有技术,特别是在处理复杂空间关系和多物体场景时表现卓越,为AI辅助创意设计开辟新可能。