近日在2024 Inclusion·外滩大会上,OceanBase CEO杨冰表示,受时代驱动,现代数据架构需要具备五大特性,分别是可扩展性、开放灵活性、多模融合、实时分析、SQL与AI融合。

杨冰认为,单一、结构化、静态数据架构的时代已经一去不复返。当今的业务由海量复杂的并发数据、动态和静态数据、多种形式的数据以及不同质量和信任程度的数据驱动,同时对数据价值的分析挖掘能力要求愈发凸显,数据库体系的变革正在呼之欲出。
从IT架构而言,SaaS层已经演变为微服务云原生架构,IaaS层也统一到云平台的接口、容器化虚拟化的计算。PaaS层经历了过去几年的升级,也已完成分布式、多租户、云原生的改造。数据库作为PaaS的底层,在上层和下层都发生架构巨变的情况下,亟需搭建现代化的数据架构。
如何探索和实践现代数据架构,是全球行业领军者和专业咨询机构的共同命题。
从全球经验与总结来看,杨冰认为,在全球范围内,对这一问题的探索都呈现出相当的共性,即现代数据架构应有可扩展性,面向海量数据,充分利用分布式高并发、可扩展性和高可用性能力,确保海量数据的可管理性;运维部署开放灵活性,可私有云、混合云、公有云,拥抱多基础设施;应多模融合,消除多数据类型带来的数据孤岛问题,简化技术栈;应实时分析,融合事务处理TP和实时分析AP,在确保数据一致性的前提下,满足实时分析需求;应将SQL和AI融合,提升开发和运行效率,支持智能数据查询分析能力。
为满足现代数据架构的需求,OceanBase持续自研创新,在性能创新、容灾创新、架构创新、数据分析创新、多云原生创新 5 个方面不断探索。刷新TPC-C、TPC-H性能榜,达成三地五中心容灾架构部署,使故障恢复进入8秒时代,实现单机分布式一体化,打破分布式和单机的架构边界,实现TP&AP一体化,面向多基础设施。
而在保持可扩展、稳定安全及低成本的核心基础上,OceanBase 也正从AI for DB、DB for AI两个层面尝试与探索。一方面,OceanBase聚焦于通过AI生成SQL语句,优化执行效率,及通过AI助力分布式数据库复杂问题的智能诊断和智能运维,另一方面正在探索通过多模引擎原生支持AI向量索引,打造面向未来的SQL+AI能力。
杨冰表示,OceanBase遵循“一体化架构、极致简约”的产品设计理念。现代企业正从传统数据架构或互联网架构向现代数据架构演进和探索,面对全新的数据管理、处理挑战,各行各业都在向统一技术栈演进,OceanBase致力于构建现代数据架构,简化技术栈服务千行百业。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。