作者 | 金旺
来源 | 科技行者
2004年,谷歌启动了一项影响深远的“登月计划”——数字图书馆计划。
作为谷歌第一个“登月计划”,这一计划旨在将当时全世界1.2亿册图书扫描成PDF格式,将人类沉淀下来的宝贵知识搬到互联网上,以期知识共享。
随后,谷歌先后与哈佛大学、斯坦福大学、牛津大学、密歇根大学等高校图书馆及城市公共图书馆签订合作协议,来完成谷歌的宏图大愿。
到2015年,《纽约时报》报道谷歌这项计划时,谷歌已经完成了超过2500万册图书的数字化。
倘若每本书以2MB来计算的话,这堪称人类历史上最早的数字化工程,十年间产生的数据量约为0.047PB。
这一年,全球数据量达到了8.6ZB,云计算、人工智能等技术正在让大数据发挥魔力,中国数字经济达到了18.6万亿元,GDP占比27.5%。
这时,作为数字经济三大IT基础设施之一,中国数据库产业首先在金融行业迎来了变革。
01 金融转向分布式
作为数据密集型产业,金融领域是最早采用数据库的产业之一,也是最早对数据库架构提出新需求的产业。
四川农商联合银行就是在2018年做出决定,要对包括数据库在内的IT基础设施进行技术转型。
四川农商联合银行,股份改制之前又称作“四川农信”,作为常年服务于四川各市县6000万用户的地方银行,四川农商联合银行拥有近5000个营业点,超4万员工,核心用户有着小额高频取现需求的特点,日交易量高达3300万笔、交易额约1000亿元,春节高峰期的几天日交易量甚至会翻一倍之多。
这是四川农商联合银行业务上的特性,在技术上,四川农商联合银行在2018年之前,有多达6种数据库,每种数据库都需要购买原厂服务,再加上设备成本、维护成本、人工成本,每年都是一笔不小的开支。
尤其四川地处地震多发地带,近十年发生的5级地震就有30多次,这样的地震对人类生活不会造成太大的影响,但对于金融行业中的大型机却存在威胁。
在地震时,一个微小的接头松动,就有可能导致几千万的交易量掉线,因而四川农商联合银行当时每年维护成本一大半都花在了大型机维护上。
再加上数据库降本增效的需求,四川农商联合银行的数据库技术转型在2018年开始提上日程。
这一年,数据库领域也有了新的架构变化。
回顾过去几十年数据库发展历程,数据库基础架构大致分为集中式和分布式两个阶段。
在早期信息化阶段,基于集中式架构的数据库一直是全球金融、电信、交通行业信息化转型的最优解,然而随着互联网的兴起,线上业务量越来越大,高昂的运维成本和烟囱式部署的历史遗留问题就成了企业数字化转型的瓶颈,基于分布式架构数据库的出现就成了历史的必然。
作为一款100%自研的原生分布式数据库,OceanBase在2010年写下了第一行代码,并在之后很长一段时间里潜心钻研、精进技术,经受内部场景的不断磨炼。
2018年,四川农商联合银行结合自身弹性业务、降本增效的需求,在2018年进行IT基础设施架构转型时,决定向分布式架构转型。
在定下这一转型战略后,四川农商联合银行发现,当时市面上可选的产品并不多,2018年3月启动POC测试时,参与POC测试的团队一共只有3个。
据四川农商联合银行相关负责人回忆,当时针对数据库主要测试场景有三个,一是大规模并发交易响应时间,二是容灾切换等异常场景的一致性,三是大规模集群管理能力。
“测试下来,OceanBase的性能表现最佳,这也是我们当时选择OceanBase的直接原因。”
随后五年里,四川农商联合银行一边是新建系统全部采用新的分布式架构,另一边也在推进存量系统大规模上云,并在2023年启动了分布式核心建设。
如今四川农商银行已经建立起三地四中心五节点多活架构,包括6大类业务49个应用系统部署在了OceanBase上,OceanBase承载的日均交易量达到了8000万元,日峰值交易量则达到1.3亿元。
而在金融行业,分布式数据库替代集中式数据库正在成为大势所趋。
包括中国工商银行、交通银行、四川农商联合银行、中国太平洋保险、招商证券等都已经采用了OceanBase,OceanBase由此也成了金融行业承载关键业务负载的核心数据库产品。
02 OceanBase冲出重围
近日,OceanBase首次对外披露了金融行业营收:
2023年,OceanBase在金融行业营收达到了2.7亿元,位列分布式数据库独立厂商之首。
这时的全球数据库产业依然热情高涨,市场上活跃着472家数据库厂商,相关产品超过500款,即便是在国内,依然有超过150家厂商、238款产品同台竞争。
OceanBase之所以能在激烈的竞争环境中有这样的业务规模和市场地位,一方面是因为金融行业数字化转型的特殊时代需求,另一方面则是由于OceanBase长达14年的技术积累。
作为国内头部保险公司,中国太平洋保险是在2021年开始转向分布式数据库的。
中国太平洋保险在经历了核心系统攻坚复杂场景打磨数据库产品后,分布式数据库成为金融行业数据库应用主流趋势已经渐趋明朗,OceanBase自2020年开始商业化运营后,也进入到了规模化推广阶段。
中国太平洋保险当时结合自身业务特性,对市面上的数据库业务进行了一系列评估,最终选择了OceanBase作为转向分布式数据库的产品。
令中国太平洋保险数智研究院首席数据库专家林春印象深刻的是,“由于保险业务复杂度高于银行,业务与原有商业数据库绑定程度也更深,因而对业务的平滑迁移要求很高。”
由于这也是OceanBase在诞生时要解决的关键问题之一,在攻坚这一问题后,强兼容性也成了OceanBase一项核心竞争力。
在中国太平洋保险转向分布式数据库时,OceanBase通过“全面语法兼容”,配合中国太平洋保险完成了“P17核心客户服务系统”平滑迁移并在2022年底上线成功,截止目前已经平稳运行了500多天。
“能够承载关键业务负载的数据库不是在实验室或办公室中写出来的,一定是在复杂业务场景中打磨出来的,”这是OceanBase副总裁、金融政企事业部总经理王爽这些年在OceanBase商业化过程中最深刻的体会,也是数据库产业的独特之处。
在过去14年里,OceanBase不仅秉持根技术100%自研,在全球12个国家和地区拿下了500+项专利,还一步步从支撑自身电商业务、移动支付业务等内部场景,到被越来越多金融机构选择。
据OceanBase官方公布数据显示,如今已经有70%千亿资产规模以上银行、75%头部证券机构、65%头部保险机构、45%头部基金公司选择了OceanBase进行核心系统升级。
来自市场调研机构IDC的统计数据显示,2023年中国金融行业分布式事务型数据库市场规模为2.2亿元,竞争格局基本稳定,头部5家厂商占据整体市场份额的86.9%。
其中,OceanBase以17.1%的市场位居独立数据库之首,仅次于三家云厂商。
不过,就金融行业而言,因其独特的行业属性,为了保障数据安全,核心交易系统只能以本地化方式部署,而本地化部署的应用系统对分布式型数据库建设要求往往要更高。
云厂商往往基于公有云开展数据库业务,因而,接下来独立数据库厂商之间的竞争将会决定未来金融行业数据库产业分布格局。
就目前来看,在市场格局逐渐趋于稳定的当下,OceanBase以36.2%的市场份额位居国内金融行业本地部署市场第一,在金融行业数据库产业中已经冲出重围。
与此同时,这份由IDC在7月18日发布的市场调研报告,对中国金融行业分布式事务型数据库市场还给出了一个重要判断——技术验证结束,迎接高速增长。
03 向分布式进发
金融行业的IT基础设施技术验证,往往由大行、股份制银行代表的头部机构牵头进行,城商行和省农信由于技术实力上的差距,其中不少机构在这个阶段会先选择观望。
从IDC的调研数据来看,国内6大行、12大股份制银行向分布式事务型数据库的改造工作的技术验证已经基本完成,随着2024年改造步伐加快,预计进度在今年将达到65%-70%。
不过,在金融行业向分布式数据库改造过程中,既有机遇,也存在挑战。
降本增效是现在各行各业数字化转型过程中面临的最大挑战,对稳定性、安全性优先级高于成本敏感度的金融行业而言,接下来,也将面临降本增效的问题。
OceanBase CEO杨冰在接受媒体采访时指出,“当行业逆风开始缩减IT基础设施成本开支时,更考验数据库厂商的核心竞争力,而OceanBase在降本方面有着极强的竞争力。”
以太平洋保险近期切换到OceanBase的核心业务之一——会计核算系统为例:
正是基于OceanBase高级压缩技术对数据库进行的“瘦身”,太平洋保险的存储成本平均节省了80%以上,通过应用模块拆分和功能优化,应收结果统计模块计算效率提升了2倍,升级后的应用系统也实现了RP0=0,RTO<30s。
这样的数据库升级效果,是金融机构快速向分布式数据库转型的主要原因,也正是在这样的发展趋势下,金融行业的数字化转型走在了全行业前列。
据赛迪顾问软件与信息服务业产业研究中心发布的《2022-2023年度中国平台软件市场研究报告》显示,金融将超越电信与互联网行业,成为平台软件增长最快、规模最大的应用市场。
本就对数据库要求更高,再加上应用成效突出、规模效益呈现,这让金融行业面向分布式数据库的转型,也将影响接下来整个数据库产业的发展。
随着金融行业分布式数据库的大规模部署,分布式数据库或将迎来一轮更大规模的产业大爆发,作为原生分布式数据库的头号玩家,如今的OceanBase在承载金融行业关键业务转型过程中,也正面临着新的机遇和挑战。
好文章,需要你的鼓励
如果说世界上有哪个市场迫切需要激烈竞争,自然就是推动AI革命的数据中心GPU市场。目前英伟达几乎就是行业内唯一的神。
近日,杂货巨头Woolworths新西兰技术总经理Steve James和我们分享了如何在极端事件中保持基本服务的运行,如何与社区互动以激励人们从事技术职业,以及如何利用技术来确保团队安全。
从业务角度来说是反映模型的初始响应速度,对于实时交互式应用非常重要,较低的TTFT可以提高用户体验,使用户感觉模型响应迅速;