3月20日,OceanBase城市行首站落地深圳,这也是OceanBase独立运营后的首次亮相。
昨日,蚂蚁集团宣布,旗下蚂蚁国际、OceanBase和蚂蚁数科已成立董事会,独立面向市场。
OceanBase CEO杨冰表示,OceanBase致力于打造负载关键业务系统的一体化数据库,作为一款100%“根自研”国产数据库,“根自研”就是OceanBase负载关键业务系统的最大底气。未来,OceanBase还会保持初心,一以贯之地为客户提供优秀的数据库服务。
OceanBase是蚂蚁集团旗下的自研原生分布式数据库,成立于2010年,历经14年发展,在技术、商业化层面取得显著成绩。2019年、2021年接连打破“数据库世界杯”TPC-C、TPC-H的世界纪录。2020年,OceanBase正式商业化,客户数已超过1000家。
14年前,中国移动互联网爆发式增长,带来了前所未有的海量数据挑战,OceanBase选择了完全从根技术自研的道路来应对这一全球独一无二的海量数据处理问题。
据杨冰介绍,目前OceanBase已经做到了100%根自研,包括从0到1自研三百万行代码、自研代码开源主导产品和社区发展方向、构建自研技术生态。基于“根自研”和中国场景的打磨,OceanBase才得以推动树立分布式数据库在性能、容灾、高可用、架构上的新标准,立足中国服务世界。
尽管刚开始举步维艰,但不基于开源数据库二次开发、自建研发环境和流程,使得OceanBase具备对内核代码的完全掌控力和掌控权,避免了开源数据库可能遭遇的协议风险,也具备了更强的突破复杂业务场景和为关键业务系统兜底的能力。
2021年开源后,OceanBase同样引领产品发展和社区方向,除了开源最核心的数据库内核代码、分布式组件和接口驱动外,还逐步将产品工具开源。截止目前,社区拥有超300位贡献者,超500家客户将OceanBase社区版应用于实际的业务生产系统,OceanBase的技术和产品得到进一步打磨。
技术生态方面,OceanBase持续构建以“合作伙伴”为中心的产品技术文化,广泛与多基础设施、数据集成、数据治理、应用集成服务商围绕OceanBase进行产品适配和对接,有超过750个主流产品已加入OceanBase自研技术生态。
杨冰认为,OceanBase已经做到对代码、社区、生态的“根自研”,而100%“根自研”就是OceanBase负载关键业务系统、为客户需求兜底的最大底气。
随着企业走向现代数据架构,数据库上承IaaS层、下接SaaS层,是IT系统中最关键、最复杂的环节,也是“最难啃的骨头”。根据IDC分布式事务数据库市场追踪报告,分布式数据库正在成为新的数据库流行趋势,越来越多的企业正在使用分布式数据进行关键业务系统升级。
基于“一体化”产品理念,OceanBase逐步实现工程一体化、TP/AP一体化、云上云下一体化、单机分布式一体化,以其高可用、高安全、高性能、高性价比,满足金融、政企、互联网等不同类型企业在关键业务系统升级上的需求。
在OceanBase1000多家客户中,已有30%将其应用于核心系统,其中不乏交通银行、中国移动、理想汽车等大型企业,场景涉及支付、金融、政务、新零售、互联网等。
据悉,在粤港澳地区,OceanBase已深耕多年,服务雄帝科技、金地集团、澳门通、工银亚洲、广东农信、顺德农商银行、招商证券、广发证券、安信证券、递四方、出行365、丽迅物流、洋葱集团等上百家企业。
其中,深圳公积金的公积金业务在线办理系统已在OceanBase上稳定运行超过1000天,平安银行的核心账务等数套关键业务系统已实现分布式升级,图匠数据两大核心业务“数货宝”、“数智柜”全面接入OceanBase的云数据库版本OB Cloud。
会上,杨冰也宣布,正式开启OceanBase 4.3 Beta版本邀测,4.3版本将推出全新的列式存储引擎,满足关键业务负载的实时分析场景诉求。
好文章,需要你的鼓励
zip2zip是一项创新技术,通过引入动态自适应词汇表,让大语言模型在推理时能够自动组合常用词组,显著提高处理效率。由EPFL等机构研究团队开发的这一方法,基于LZW压缩算法,允许模型即时创建和使用"超级tokens",将输入和输出序列长度减少20-60%,大幅提升推理速度。实验表明,现有模型只需10个GPU小时的微调即可适配此框架,在保持基本性能的同时显著降低计算成本和响应时间,特别适用于专业领域和多语言场景。
这项研究创新性地利用大语言模型(LLM)代替人类标注者,创建了PARADEHATE数据集,用于仇恨言论的无毒化转换。研究团队首先验证LLM在无毒化任务中表现可与人类媲美,随后构建了包含8000多对仇恨/非仇恨文本的平行数据集。评估显示,在PARADEHATE上微调的模型如BART在风格准确性、内容保留和流畅性方面表现优异,证明LLM生成的数据可作为人工标注的高效替代方案,为创建更安全、更具包容性的在线环境提供了新途径。
这项研究由中国科学技术大学的研究团队提出了Pro3D-Editor,一种新型3D编辑框架,通过"渐进式视角"范式解决了现有3D编辑方法中的视角不一致问题。传统方法要么随机选择视角迭代编辑,要么同时编辑多个固定视角,都忽视了不同编辑任务对应不同的"编辑显著性视角"。Pro3D-Editor包含三个核心模块:主视角采样器自动选择最适合编辑的视角,关键视角渲染器通过创新的MoVE-LoRA技术将编辑信息传递到其他视角,全视角精修器修复并优化最终3D模型。实验证明该方法在编辑质量和准确性方面显著优于现有技术。
这项研究提出了ComposeAnything,一个无需重新训练的框架,可显著提升AI图像生成模型处理复杂空间关系的能力。该技术由INRIA、巴黎高师和CNRS的研究团队开发,通过三个创新步骤工作:首先利用大型语言模型创建包含深度信息的2.5D语义布局,然后生成粗略的场景合成图作为先验指导,最后通过物体先验强化和空间控制去噪引导扩散过程。在T2I-CompBench和NSR-1K基准测试中,该方法远超现有技术,特别是在处理复杂空间关系和多物体场景时表现卓越,为AI辅助创意设计开辟新可能。