Oracle最近宣布推出了Exadata Database Service on Exascale (ExaDB-XS),旨在提高数据库工作负载的性能并降低成本。
Exascale的架构是Oracle多租户架构,可以分配针对其数据库智能地分配计算优化了的计算池,这种架构运行在和Exadata Database Service on Dedicated Infrastructure想用的设备上,例如X8M、X9M和X10M。Exadata的历史可以追溯到十年前,是Oracle关系型数据库的基础设施。
新功能专注于AI工作负载和矢量数据库,以及按使用付费的成本结构。
自从X8M设备上市以来,Oracle就通过RoCE网络将服务器连接到存储,并且Oracle的存储服务器配备了XRMEM内存,可以通过NVMe驱动器和硬盘RDMA进行访问,以形成三层存储:热存储、温存储和冷存储。
这种逻辑被用于共享架构,主要是通过修改数据库的软件管理实现的。
“在此之前,每个租户都有自己专用的Exadata计算和存储,”Oracle Exadata和横向扩展技术高级副总裁Kodi Umamageswaran这样表示。
“我们有一个名为Automatic Storage Management (ASM)的软件,用于在数据库之间分配存储。现在,一个通用的百亿亿次计算和存储池负责数千个租户和数百万个数据库。”
总而言之,会有一个特定的百亿亿次控制平面用于管理虚拟机和存储。
传统上,Oracle是通过LUN来表示操作系统中的每个硬盘,并以文件的形式管理所有逻辑资产,如数据库中的数据、快照、重做日志、克隆和存储块。
但使用Oracle ASM,每个文件类型都是由和数据库、恢复文件、快照和扩展存储配置相关的每组驱动器共享的,有助于确保数据的冗余,以及和单独存储卷是分开的。
从现在开始,使用Exascale,文件类型将决定冗余。模板允许配置冗余级别,控制平面确保数据不会存储在同一驱动器上。
此外,文件被划分为8MB的“区段”,选择8MB是为了优化多租户架构中的性能。“这些8MB区段足够大,可以在我们扫描连续数据时获得良好的连续性能,同时又足够小,可以将数据库分布在存储云中,以共享I/O负载。”
扩展区段通过哈希码分配给存储桶,映射表指示这些区段存储在了哪个磁盘上。“位于存储桶中的所有扩展区段都以冗余方式存储在三个存储服务器上的三个磁盘上,以应对存储中断和服务中断的发生,”Umamageswaran说。
存储桶的最大数量固定为100000,“足以在数千台存储服务器之间共享数据,并且足够小,可以容纳保存在客户端数据库服务器缓存中的对应表,”他说。
性能相当于专用基础设施
这种架构使用了RoCE网络和RDMA连接协议,可以实现与专用Exadata服务类似的性能——在X10M服务器上,通用基准工作负载的吞吐量为2880GBps,延迟为17µs。
这种性能源自实时数据分层,并且可以自动并行化SQL处理等。
开发人员可以从生产数据库或快照中创建完整或“精简”的数据库克隆中从中获益。重定向写入技术减少了克隆所需的存储容量,因为克隆共享原始数据库的块而不保存新的数据。但是,这些功能中大多数已经存在。
管理员现在可以看到连接到虚拟机集群的“保险库”,而不是磁盘组,这些保险库实际上是逻辑存储容器,从连接到虚拟机集群的物理服务器中提取资源。
这种保险库代表了一种新的、更直观的管理员工作方式,是由Oracle数据库直接使用的,而不是ASM磁盘组。
在部署期间,可以配置虚拟机、附加保险库,使用和虚拟云网络及其客户端和备份网络相同的方式来配置数据库容器映像。
管理员可以部署2到10个虚拟机,每个虚拟机在Oracle的ECPU模式中每小时分配一定数量的核心。一个保险库的存储空间在300GB到100TB之间。
规模较小 成本更低
由于采用了多租户架构,ExaDB-XS的成本将比Exadata Cloud Infrastructure X9M Dedicated低95%。
对于使用四分之一机架X9M(即两个数据库服务器用于三个存储服务器)的基本配置(包括许可)来说,专有的Exadata Cloud Infrastructure每个月成本约为10000欧元,而Exadata Exascale基础设施的每月成本约为330欧元。
你必须添加正在运行的Exadata Database服务,Oracle会通过RDMA进行处理以开具发票。ExaDB-XS的基本实例每月成本约为4000欧元,而云端X9M专用实例每个月的成本为13700欧元,Exadata Database Service关联4个OCPU(8vCPU),可以节省成本约70%。
虽然四分之一机架X9M实例具有更大的存储容量(190TB),但4个OCPU不足以处理如此大量的数据。因此,对于相同的存储容量来说,Exadata Exascale的成本可能并不低。
“Exascale的成本较低,因此大型企业和中小型企业可以将其用于小型工作负载,”Umamageswaran说。
分析师一致认为,Oracle面对竞争对手的竞争正在持续进行创新,其中最关键的就是PostgreSQL及其变体,得到了云巨头的大规模部署支持,还有MongoDB。Oracle在提供基于使用量的许可方面进展缓慢,但似乎有意迎头赶上。
Umamageswaran表示,未来Exadata Exascale将成为Oracle云基础设施中所有数据库服务的底层架构。
好文章,需要你的鼓励
谷歌发布新的AI学术搜索工具Scholar Labs,旨在回答详细研究问题。该工具使用AI识别查询中的主要话题和关系,目前仅对部分登录用户开放。与传统学术搜索不同,Scholar Labs不依赖引用次数或期刊影响因子等传统指标来筛选研究质量,而是通过分析文档全文、发表位置、作者信息及引用频次来排序。科学界对这种忽略传统质量评估方式的新方法持谨慎态度,认为研究者仍需保持对文献质量的最终判断权。
Meta公司FAIR实验室与UCLA合作开发了名为HoneyBee的超大规模视觉推理数据集,包含250万训练样本。研究揭示了构建高质量AI视觉推理训练数据的系统方法,发现数据质量比数量更重要,最佳数据源比最差数据源性能提升11.4%。关键创新包括"图片说明书"技术和文字-图片混合训练法,分别提升3.3%和7.5%准确率。HoneyBee训练的AI在多项测试中显著超越同规模模型,同时降低73%推理成本。
Meta发布第三代SAM(分割一切模型)系列AI模型,专注于视觉智能而非语言处理。该模型擅长物体检测,能够精确识别图像和视频中的特定对象。SAM 3在海量图像视频数据集上训练,可通过点击或文本描述准确标识目标物体。Meta将其应用于Instagram编辑工具和Facebook市场功能改进。在野生动物保护方面,SAM 3与保护组织合作分析超万台摄像头捕获的动物视频,成功识别百余种物种,为生态研究提供重要技术支持。
上海AI实验室团队提出ViCO训练策略,让多模态大语言模型能够根据图像语义复杂度智能分配计算资源。通过两阶段训练和视觉路由器,该方法在压缩50%视觉词汇的同时保持99.6%性能,推理速度提升近一倍,为AI效率优化提供了新思路。