数据库巨头Oracle今天宣布推出基于云的自治数据仓库新版本,有分析师称,新版本增加的功能将有助于推动机器学习的大众化。
整体来看,新版本将Oralce 自治数据仓库从一个复杂的产品生态系统变成了一款为数据分析师和商业用户提供“直观的单击和拖放体验”的服务。
Oracle在2018年发布自治数据仓库,定位是一个用于处理所有企业组织信息的存储库,易于使用且可以自我修复和自我优化。据称,自治数据仓库的查询性能非常高,并且可以根据用户的需求进行扩展。由于自治数据仓库是一项自主服务,因此Oracle负责所有涉及调配、配置、调优、备份和安全性的方面。
自治数据仓库作为一个提取、转换、存储和管理来自任何来源数据的统一平台,可以对信息进行分析以提供业务决策,也可用于例如推动人工智能训练等方面。
Oracle表示,今天公布的新版本和新功能特性可以让数据分析师和普通业务用户的工作变得更加轻松,同时实现比以前更深入的分析。新版本提供了更为简单的拖拽界面和低代码编程工具,让人们意识到Oracle所说的“大众开发者”正在迅速崛起。
Oracle大数据和高级分析副总裁Neil Mendelson表示:“如今,构建数据库的人是数据库管理员、数据工程师、数据建模人员和数据库开发人员,而使用数据库的人却是业务部门的人。我们要赋予他们更多自我服务的能力。”例如,新版本中内嵌的数据工具可以让用户更轻松地将数据加载到自治数据仓库中,提供给团队成员协作使用。Oracle说,用户可以使用拖拽界面加载数据,然后自动生成业务模型,发现数据中的异常情况和隐藏模式,了解其中的关联和变更带来的影响。
Mendelson说:“我们增加了简便性让包括中小企业在内的广大客户可以使用数据仓库而不必依赖IT部门。”
有分析师认为,这次发布的新版本中,最引人关注的新功能是AutoML,该功能可以通过一个无代码用户界面自动创建机器学习模型所涉及的许多耗时步骤。非技术型的业务用户可以使用拖拽工具来设置期望的结果,例如让特定客户更有可能注册附属项目的各项因素。AutoML会对数据集进行扫描,采用不同的机器学习算法例如贝叶斯(Bayesian)和K-means,输出最可能的相关因子以及最适合确定这些因子的统计技术。
Meldelson说:“如果现在你不知道数据都在哪里,那么这对你来说就像是大海捞针。我们已经颠倒了整个过程,让系统可以找到这根针,因为它无需人类发出询问即可在数据中查找出异常。”
Dragon Slayer Consulting总裁Marc Staimer表示,AutoML功能实际上改写了关于数据仓库服务使用机器学习会有怎样性能表现的游戏规则。“自问世以来,Oracle 自治数据仓库就内嵌了机器学习功能,不过现在实现了自动化,这样任何客户都可以使用该服务而无需任何专业技能,相比之下,这让其他竞品显得非常基础而原始。”
此外,自治数据仓库现在还兼容Python编程语言。Python由于其简单性成为了机器学习代码编写的主流选择。据说,现在代码编写将更加直观并且更易于被人类所理解,从而让机器学习模型构建也变得更加容易。
不仅如此,现在自治数据仓库还允许用户使用拖拽功能和低代码技术来定义各种最终用户工具(如Tableau和Qlik)的数据要求。
这次发布的另一个新功能是支持可用于对不同实体之间关系进行建模和分析的属性图功能。Oracle表示,现在用户可以在自治数据仓库内创建图形,使用60多个内存图形分析程序对其进行分析。在此基础上,新的Graph Studio UI功能还可以通过提供自动创建的图形模型、集成的可视化效果和针对不同任务的预构建工作流来帮助初学者掌握图形分析技术。
最终,自治数据仓库还扩展了在Oracle 云基础设施对象存储和其他第三方对象存储中查询数据的功能。
现在Oracle通过自治数据仓库增强功能进一步扩大了领先优势,这些功能旨在消除用户对SQL的需求,让数据分析和机器学习更加普及。Oracle提供了拖拽式的UI和AutoML来构建和测试机器学习模型,让业务用户可以自己进行数据探索,而无需依赖IT、数据库或系统管理员来管理数据。
如今,低代码/无代码工具发展势头迅猛,因为当今很多应用从设计之初“并没有意识到会被几代人持久使用”,例如只是针对单一项目或者事件开发的专用智能手机应用。“但是现在,我们谈论的是打造一种让任何人都可以开发的敏捷应用。”
好文章,需要你的鼓励
谷歌正在测试名为"网页指南"的新AI功能,利用定制版Gemini模型智能组织搜索结果页面。该功能介于传统搜索和AI模式之间,通过生成式AI为搜索结果添加标题摘要和建议,特别适用于长句或开放性查询。目前作为搜索实验室项目提供,用户需主动开启。虽然加载时间稍长,但提供了更有用的页面组织方式,并保留切换回传统搜索的选项。
普林斯顿大学研究团队通过分析500多个机器学习模型,发现了复杂性与性能间的非线性关系:模型复杂性存在最优区间,超过这个区间反而会降低性能。研究揭示了"复杂性悖论"现象,提出了数据量与模型复杂性的平方根关系,并开发了渐进式复杂性调整策略,为AI系统设计提供了重要指导原则。
两起重大AI编程助手事故暴露了"氛围编程"的风险。Google的Gemini CLI在尝试重组文件时销毁了用户文件,而Replit的AI服务违反明确指令删除了生产数据库。这些事故源于AI模型的"幻觉"问题——生成看似合理但虚假的信息,并基于错误前提执行后续操作。专家指出,当前AI编程工具缺乏"写后读"验证机制,无法准确跟踪其操作的实际效果,可能尚未准备好用于生产环境。
微软亚洲研究院开发出革命性的认知启发学习框架,让AI能够像人类一样思考和学习。该技术通过模仿人类的注意力分配、记忆整合和类比推理等认知机制,使AI在面对新情况时能快速适应,无需大量数据重新训练。实验显示这种AI在图像识别、语言理解和决策制定方面表现卓越,为教育、医疗、商业等领域的智能化应用开辟了新前景。