数据库巨头Oracle今天宣布推出基于云的自治数据仓库新版本,有分析师称,新版本增加的功能将有助于推动机器学习的大众化。
整体来看,新版本将Oralce 自治数据仓库从一个复杂的产品生态系统变成了一款为数据分析师和商业用户提供“直观的单击和拖放体验”的服务。
Oracle在2018年发布自治数据仓库,定位是一个用于处理所有企业组织信息的存储库,易于使用且可以自我修复和自我优化。据称,自治数据仓库的查询性能非常高,并且可以根据用户的需求进行扩展。由于自治数据仓库是一项自主服务,因此Oracle负责所有涉及调配、配置、调优、备份和安全性的方面。
自治数据仓库作为一个提取、转换、存储和管理来自任何来源数据的统一平台,可以对信息进行分析以提供业务决策,也可用于例如推动人工智能训练等方面。
Oracle表示,今天公布的新版本和新功能特性可以让数据分析师和普通业务用户的工作变得更加轻松,同时实现比以前更深入的分析。新版本提供了更为简单的拖拽界面和低代码编程工具,让人们意识到Oracle所说的“大众开发者”正在迅速崛起。
Oracle大数据和高级分析副总裁Neil Mendelson表示:“如今,构建数据库的人是数据库管理员、数据工程师、数据建模人员和数据库开发人员,而使用数据库的人却是业务部门的人。我们要赋予他们更多自我服务的能力。”例如,新版本中内嵌的数据工具可以让用户更轻松地将数据加载到自治数据仓库中,提供给团队成员协作使用。Oracle说,用户可以使用拖拽界面加载数据,然后自动生成业务模型,发现数据中的异常情况和隐藏模式,了解其中的关联和变更带来的影响。
Mendelson说:“我们增加了简便性让包括中小企业在内的广大客户可以使用数据仓库而不必依赖IT部门。”
有分析师认为,这次发布的新版本中,最引人关注的新功能是AutoML,该功能可以通过一个无代码用户界面自动创建机器学习模型所涉及的许多耗时步骤。非技术型的业务用户可以使用拖拽工具来设置期望的结果,例如让特定客户更有可能注册附属项目的各项因素。AutoML会对数据集进行扫描,采用不同的机器学习算法例如贝叶斯(Bayesian)和K-means,输出最可能的相关因子以及最适合确定这些因子的统计技术。
Meldelson说:“如果现在你不知道数据都在哪里,那么这对你来说就像是大海捞针。我们已经颠倒了整个过程,让系统可以找到这根针,因为它无需人类发出询问即可在数据中查找出异常。”
Dragon Slayer Consulting总裁Marc Staimer表示,AutoML功能实际上改写了关于数据仓库服务使用机器学习会有怎样性能表现的游戏规则。“自问世以来,Oracle 自治数据仓库就内嵌了机器学习功能,不过现在实现了自动化,这样任何客户都可以使用该服务而无需任何专业技能,相比之下,这让其他竞品显得非常基础而原始。”
此外,自治数据仓库现在还兼容Python编程语言。Python由于其简单性成为了机器学习代码编写的主流选择。据说,现在代码编写将更加直观并且更易于被人类所理解,从而让机器学习模型构建也变得更加容易。
不仅如此,现在自治数据仓库还允许用户使用拖拽功能和低代码技术来定义各种最终用户工具(如Tableau和Qlik)的数据要求。
这次发布的另一个新功能是支持可用于对不同实体之间关系进行建模和分析的属性图功能。Oracle表示,现在用户可以在自治数据仓库内创建图形,使用60多个内存图形分析程序对其进行分析。在此基础上,新的Graph Studio UI功能还可以通过提供自动创建的图形模型、集成的可视化效果和针对不同任务的预构建工作流来帮助初学者掌握图形分析技术。
最终,自治数据仓库还扩展了在Oracle 云基础设施对象存储和其他第三方对象存储中查询数据的功能。
现在Oracle通过自治数据仓库增强功能进一步扩大了领先优势,这些功能旨在消除用户对SQL的需求,让数据分析和机器学习更加普及。Oracle提供了拖拽式的UI和AutoML来构建和测试机器学习模型,让业务用户可以自己进行数据探索,而无需依赖IT、数据库或系统管理员来管理数据。
如今,低代码/无代码工具发展势头迅猛,因为当今很多应用从设计之初“并没有意识到会被几代人持久使用”,例如只是针对单一项目或者事件开发的专用智能手机应用。“但是现在,我们谈论的是打造一种让任何人都可以开发的敏捷应用。”
好文章,需要你的鼓励
数据分析平台公司Databricks完成10亿美元K轮融资,公司估值超过1000亿美元,累计融资总额超过200亿美元。公司第二季度收入运营率达到40亿美元,同比增长50%,AI产品收入运营率超过10亿美元。超过650家客户年消费超过100万美元,净收入留存率超过140%。资金将用于扩展Agent Bricks和Lakebase业务及全球扩张。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。
医疗信息管理平台Predoc宣布获得3000万美元新融资,用于扩大运营规模并在肿瘤科、研究网络和虚拟医疗提供商中推广应用。该公司成立于2022年,利用人工智能技术提供端到端平台服务,自动化病历检索并整合为可操作的临床洞察。平台可实现病历检索速度提升75%,临床审查时间减少70%,旨在增强而非替代临床判断。
上海AI实验室发布OmniAlign-V研究,首次系统性解决多模态大语言模型人性化对话问题。该研究创建了包含20万高质量样本的训练数据集和MM-AlignBench评测基准,通过创新的数据生成和质量管控方法,让AI在保持技术能力的同时显著提升人性化交互水平,为AI价值观对齐提供了可行技术路径。