至顶网软件与服务频道消息:5月21日,被誉为“数据库领域世界杯”的数据库基准测试TPC-C官网更新了最新结果,支付宝自研数据库OceanBase打破去年自己创造的世界纪录,性能分数首次突破亿级大关达到7.07亿tpmC,相比去年的成绩提升近11倍。
(TPC-C最新榜单,支付宝OceanBase打破去年自己创造的世界纪录)
TPC-C是全球主流计算机硬件厂商、数据库厂商公认的性能评价标准,其对数据库系统的软硬件协同能力要求极高。TPC-C标准模拟了经典交易场景来做测试,通过每分钟创建新订单数量来评价数据库的性能和性价比,其规定测试任务需要在指定时间内完成,95%事务在1s内完成。过去三十多年,仅有少数公司入选,榜单性能分数也长期停留在千万级。
在2019年之前,这一测试的最好成绩来自甲骨文的3024万tpmC,去年10月,OceanBase首次参加TPC-C测试,性能分数达到6088万tpmC,而此次,更实现了从千万级到亿级的历史性重大突破,榜单显示,OceanBase性能成绩达到7.07亿tpmC,比7个月前提升近11倍。
tpmC是指每分钟创建新订单的数量,现实中最大高并发可类比的场景是双11。数据显示,2019年天猫双11当天订单创建峰值为每秒54.4万笔。
据介绍,OceanBase的突破在于其采用了新一代分布式处理技术,颠覆了传统数据库集中式技术架构。传统数据库只能通过提升单机性能来提升整体性能,难以满足市场持续扩张的数据处理需求。OceanBase通过分布式扩展集群实现扩展能力的大幅提升,并通过分布式选举技术、事务技术充分保证业务场景的一致性,实现整体性能的数量级提升。
“数据库是信息社会的重要基础设施,支撑人类经济社会活动中的关键核心业务。在当今以互联网为主要载体的数字经济时代,现象级应用对事务处理吞吐率提出了前所未有的挑战。”华东师范大学副校长周傲英教授表示,“OceanBase这次在TPC-C测试中的以数量级的优势领先,再次充分说明系统的分布式架构和实现技术具有科学性和先进性,代表未来数据库的发展方向,是我国IT硬核科技领域实现替代工程和转型升级并举的创新榜样。”
据悉,目前,OceanBase集群节点数突破了1500,创始人阳振坤表示:“OceanBase是目前全球唯一超千个节点并通过TPC-C测试的数据库,突破了传统数据库的性能实瓶颈,未来分布式数据库将成为大规模业务处理的标配。”
2010年,OceanBase项目在阿里内部启动,阿里大规模大容量的互联网场景和支付宝金融级一致性要求推动OceanBase持续创新,开辟了数据库领域的新赛道,实现数据库技术的革命性突破。
OceanBase总经理杨冰表示,在数据库发展的历程上,OceanBase还是一个年轻人,我们能在TPC-C测试中证明自己,是站在前辈的肩膀上迈出的一小步,更是互联网时代给我们的机会。万里长征刚刚开始,未来我们还有很长的路要走。
目前,OceanBase已服务大量金融、电信等行业企业,在建设银行、南京银行、西安银行、人保健康险、苏州银行、广东农信、网商银行等多家商业银行和保险机构上线。全球前四名的支付平台,两家的核心系统都在使用OceanBase数据库。今年3月,OceanBase正式通过阿里云向全球开放,企业可在云上获得“支付宝同款”的世界顶级数据库处理能力。
好文章,需要你的鼓励
Converge Bio完成550万美元种子轮融资,由TLV Partners领投。该公司专为生物科技和制药行业打造LLM应用平台,提供数据增强、模型微调及可解释性分析等功能,帮助企业将通用生物基础模型转化为可实际落地的研发工具。以抗体研究为例,平台可将抗体LLM精调至氨基酸级别的结合亲和力预测,并生成优化序列。公司计划用于扩充团队、拓展客户,并发布抗体设计科研论文。
香港大学与哈尔滨工业大学联合发布的这项研究(arXiv:2605.06196)发现,大语言模型在扮演不同社会层级角色时,内部神经网络存在一条清晰的"粒度轴",从普通个人视角延伸至全球机构视角。这条轴是AI角色空间的主导几何方向,可被测量、被跨模型复现,并通过激活引导技术加以操控,为AI社会模拟的可信度评估和角色视角的主动调控提供了新工具。
ChatGPT高级语音模式的创造者Alexis Conneau离开OpenAI后,创办了音频AI初创公司WaveForms AI,并获得由a16z领投的4000万美元种子轮融资。该公司专注于训练自有音频大语言模型,计划于2025年推出与OpenAI、谷歌竞争的AI音频产品。Conneau深受电影《Her》启发,致力于开发具备情感感知能力的语音AI,同时警惕AI伴侣化带来的社会问题,强调技术应服务于人而非取代人际关系。
华盛顿大学研究团队发现,在AI数学推理训练中,将随机拼凑的拉丁文占位词(Lorem Ipsum)添加到题目前,能帮助AI突破"全部答错、训练停滞"的困境,在多个模型上平均提升推理得分2.8至6.2分。研究揭示了有效扰动的两个关键特征:使用拉丁语词汇避免语义干扰,以及保持较低困惑度确保AI能正确理解题目内容。