近日在2024 Inclusion·外滩大会上,OceanBase CEO杨冰表示,受时代驱动,现代数据架构需要具备五大特性,分别是可扩展性、开放灵活性、多模融合、实时分析、SQL与AI融合。

杨冰认为,单一、结构化、静态数据架构的时代已经一去不复返。当今的业务由海量复杂的并发数据、动态和静态数据、多种形式的数据以及不同质量和信任程度的数据驱动,同时对数据价值的分析挖掘能力要求愈发凸显,数据库体系的变革正在呼之欲出。
从IT架构而言,SaaS层已经演变为微服务云原生架构,IaaS层也统一到云平台的接口、容器化虚拟化的计算。PaaS层经历了过去几年的升级,也已完成分布式、多租户、云原生的改造。数据库作为PaaS的底层,在上层和下层都发生架构巨变的情况下,亟需搭建现代化的数据架构。
如何探索和实践现代数据架构,是全球行业领军者和专业咨询机构的共同命题。
从全球经验与总结来看,杨冰认为,在全球范围内,对这一问题的探索都呈现出相当的共性,即现代数据架构应有可扩展性,面向海量数据,充分利用分布式高并发、可扩展性和高可用性能力,确保海量数据的可管理性;运维部署开放灵活性,可私有云、混合云、公有云,拥抱多基础设施;应多模融合,消除多数据类型带来的数据孤岛问题,简化技术栈;应实时分析,融合事务处理TP和实时分析AP,在确保数据一致性的前提下,满足实时分析需求;应将SQL和AI融合,提升开发和运行效率,支持智能数据查询分析能力。
为满足现代数据架构的需求,OceanBase持续自研创新,在性能创新、容灾创新、架构创新、数据分析创新、多云原生创新 5 个方面不断探索。刷新TPC-C、TPC-H性能榜,达成三地五中心容灾架构部署,使故障恢复进入8秒时代,实现单机分布式一体化,打破分布式和单机的架构边界,实现TP&AP一体化,面向多基础设施。
而在保持可扩展、稳定安全及低成本的核心基础上,OceanBase 也正从AI for DB、DB for AI两个层面尝试与探索。一方面,OceanBase聚焦于通过AI生成SQL语句,优化执行效率,及通过AI助力分布式数据库复杂问题的智能诊断和智能运维,另一方面正在探索通过多模引擎原生支持AI向量索引,打造面向未来的SQL+AI能力。
杨冰表示,OceanBase遵循“一体化架构、极致简约”的产品设计理念。现代企业正从传统数据架构或互联网架构向现代数据架构演进和探索,面对全新的数据管理、处理挑战,各行各业都在向统一技术栈演进,OceanBase致力于构建现代数据架构,简化技术栈服务千行百业。
好文章,需要你的鼓励
英特尔携手戴尔以及零克云,通过打造“工作站-AI PC-云端”的协同生态,大幅缩短AI部署流程,助力企业快速实现从想法验证到规模化落地。
意大利ISTI研究院推出Patch-ioner零样本图像描述框架,突破传统局限实现任意区域精确描述。系统将图像拆分为小块,通过智能组合生成从单块到整图的统一描述,无需区域标注数据。创新引入轨迹描述任务,用户可用鼠标画线获得对应区域描述。在四大评测任务中全面超越现有方法,为人机交互开辟新模式。
阿联酋阿布扎比人工智能大学发布全新PAN世界模型,超越传统大语言模型局限。该模型具备通用性、交互性和长期一致性,能深度理解几何和物理规律,通过"物理推理"学习真实世界材料行为。PAN采用生成潜在预测架构,可模拟数千个因果一致步骤,支持分支操作模拟多种可能未来。预计12月初公开发布,有望为机器人、自动驾驶等领域提供低成本合成数据生成。
MIT研究团队发现,AI系统无需严格配对的多模态数据也能显著提升性能。他们开发的UML框架通过参数共享让AI从图像、文本、音频等不同类型数据中学习,即使这些数据间没有直接对应关系。实验显示这种方法在图像分类、音频识别等任务上都超越了单模态系统,并能自发发展出跨模态理解能力,为未来AI应用开辟了新路径。