10月2日,国际事务处理性能委员会(TPC)宣布,在最新发布的TPC-C 排行榜中,蚂蚁金服自研数据库 OceanBase 刷新甲骨文保持了9年的记录,跃居第一。
作为我国在“核高基”领域的重大突破,这消息一出便在业界迅速激起了“千层浪”——第一波浪,是不可避免的一片欢呼和喝彩,认为这是我国企业在数据库领域取得的巨大突破,是我国技术自主研发的代表性事件;第二波浪,是兴奋感退去后的冷思考,认为甲骨文产品经过9年更新换代,如今的技术也已经不可同日而语。
对此,DWorks面向用户进行了调研,并据此撰写了报告《中国自研数据库登顶TPC-C的意义》,供大家作为参考。
一、OceanBase登顶TPC-C大家怎么看?
调查显示:
> 超过一半(53.6%)的受访者认为,这一事件是国产数据库自信心的突显,说明我们与国外数据库的差距在缩小;
> 17.9%的受访者认为这是一个里程碑事件,说明国产数据库已经崛起;
> 14.3%的受访者则认为OceanBase与甲骨文9年前的测试结果做对比没有意义;
> 10.7%的受访者表示,由于基于对硬件体系不同,二者之间不存在可比性。
可以看到,大多数的受访者更偏理性。首先,是从时差上,榜单上排名第二的是Oracle在2011年的测试结果,这只能说明OceanBase的性能比Oracle数据库9年前的性能高一倍;其次,是从硬件体系上, OceanBase这次测试使用了6720个CPU核(主频2.65G),9年前Oracle使用的是1728个CPU核(主频1.65G),在可比性上也有待商榷。不过,值得肯定的是,在多年之后,终于有一个国产数据库品牌敢于挑战Oracle,这确实是我们在自研技术领域信心的树立和突显。
二、TPC-C榜单对数据库选型的参考意义
调查显示:
> 67.9%的受访者表示,在数据库选型时会参考TPC-C的测试结果;
> 另外32.1%的受访者表示,在数据库选型时不会参考TPC-C的测试结果。
对用户来说,性能是数据库选型时最重要的指标之一。而TPC-C作为权威的测试基准,确实是一个能够直观反映软硬件性能的方式。这从调研结果中,用户对TPC-C的认可度上对也可以看出来。
同时,这也从另一个侧面说明, 蚂蚁金服通过“打榜”力推OceanBase的方式,在市场影响力和技术认可度层面也将达到一定效果。
三、企业正在使用的数据库品牌是什么?
调查显示:
> Oracle仍然是目前企业使用最多的数据库品牌,占比达到46.4%;
> 使用阿里数据库的用户占比17.9%;
> 微软和IBM的数据库产品分列第三、第四,分别占比14.3%、7.1%。
在数据库品牌的选择上,Oracle仍然遥遥领先,这得益于其在品牌、功能、性能、可靠性、核心业务系统兼容性等方面的优势。此外在产品创新方面,近期Oracle针对数据库还提出了“自治”的概念,将机器学习应用于数据库管理;同时,IBM也提出了人工智能数据库的概念,在DB2中融入了AI技术。
但值得注意的是,随着越来越多国产数据库,以及以阿里、腾讯、AWS为代表推出的云数据库产品的兴起,整个市场格局也正在发生变化。一方面, Oracle、微软、IBM等传统数据库厂商或许不应该小觑新型数据库厂商的潜力;另一方面, OceanBase如果要推进商业化,除了传统数据库领域之外,还应该考虑如何与这些新型数据库厂商进行PK。
四、企业在选择数据库产品时最看重什么?
调查显示:
> 用户最关心的仍然是数据库的稳定性和安全性,占比57.1%;
> 事务处理速度和性价比的关注度在调查比例上出现一致,均占比17.9%;
> 另外,还有7.1%的用户表示比较看重后期维护成本。
由于数据库承载的是用户的核心数据,任何问题和事故的出现都将给企业业务带来巨大打击和损失。因此,稳定性和安全性必然是数据库选型的首要考量因素。而对于此次OceanBase在TPC-C的测试结果,体现的主要也是它的处理能力、性价比、稳定性和安全性三个方面,这说明,OceanBase想要打入B端市场凭借的不仅是“噱头”,而是确实有着非常靠谱的竞争实力。
总结
首先,数据库作为最重要的基础软件之一,其取得的突破性发展对于我国信息科技的自主研发确实具有代表性意义;其次,对于蚂蚁金服本身而言,凭借在TPC-C测试中的可靠表现,至少在市场影响力提升方面也达到了预期,这将成为OceanBase实现商业化的一个重要砝码。
然而,除了性能之外,产品本身的兼容性、产品与业务的结合度等等也是企业关注的重点,这有赖于长期的技术基础积累和强大的生态系统构建,需要更多科技企业和技术人的持续投入与坚持。
好文章,需要你的鼓励
在AI智能体的发展中,记忆能力成为区分不同类型的关键因素。专家将AI智能体分为七类:简单反射、基于模型反射、目标导向、效用导向、学习型、多智能体系统和层次化智能体。有状态的智能体具备数据记忆能力,能提供持续上下文,而无状态系统每次都重新开始。未来AI需要实现实时记忆访问,将存储与计算集成在同一位置,从而创造出具备人类般记忆能力的数字孪生系统。
中国人民大学和字节跳动联合提出Pass@k训练方法,通过给AI模型多次答题机会来平衡探索与利用。该方法不仅提升了模型的多样性表现,还意外改善了单次答题准确率。实验显示,经过训练的7B参数模型在某些任务上超越了GPT-4o等大型商业模型,为AI训练方法论贡献了重要洞察。
OpenAI首席执行官阿尔特曼表示,公司计划在不久的将来投入数万亿美元用于AI基础设施建设,包括数据中心建设等。他正在设计新型金融工具来筹集资金。阿尔特曼认为当前AI投资存在过度兴奋现象,类似于90年代互联网泡沫,但AI技术本身是真实且重要的。他承认GPT-5发布存在问题,并表示OpenAI未来可能会上市。
南加州大学等机构研究团队开发出突破性的"N-gram覆盖攻击"方法,仅通过分析AI模型生成的文本内容就能检测其是否记住了训练数据,无需访问模型内部信息。该方法在多个数据集上超越传统方法,效率提升2.6倍。研究还发现新一代AI模型如GPT-4o展现出更强隐私保护能力,为AI隐私审计和版权保护提供了实用工具。