近日在2024 Inclusion·外滩大会上,OceanBase CEO杨冰表示,受时代驱动,现代数据架构需要具备五大特性,分别是可扩展性、开放灵活性、多模融合、实时分析、SQL与AI融合。
杨冰认为,单一、结构化、静态数据架构的时代已经一去不复返。当今的业务由海量复杂的并发数据、动态和静态数据、多种形式的数据以及不同质量和信任程度的数据驱动,同时对数据价值的分析挖掘能力要求愈发凸显,数据库体系的变革正在呼之欲出。
从IT架构而言,SaaS层已经演变为微服务云原生架构,IaaS层也统一到云平台的接口、容器化虚拟化的计算。PaaS层经历了过去几年的升级,也已完成分布式、多租户、云原生的改造。数据库作为PaaS的底层,在上层和下层都发生架构巨变的情况下,亟需搭建现代化的数据架构。
如何探索和实践现代数据架构,是全球行业领军者和专业咨询机构的共同命题。
从全球经验与总结来看,杨冰认为,在全球范围内,对这一问题的探索都呈现出相当的共性,即现代数据架构应有可扩展性,面向海量数据,充分利用分布式高并发、可扩展性和高可用性能力,确保海量数据的可管理性;运维部署开放灵活性,可私有云、混合云、公有云,拥抱多基础设施;应多模融合,消除多数据类型带来的数据孤岛问题,简化技术栈;应实时分析,融合事务处理TP和实时分析AP,在确保数据一致性的前提下,满足实时分析需求;应将SQL和AI融合,提升开发和运行效率,支持智能数据查询分析能力。
为满足现代数据架构的需求,OceanBase持续自研创新,在性能创新、容灾创新、架构创新、数据分析创新、多云原生创新 5 个方面不断探索。刷新TPC-C、TPC-H性能榜,达成三地五中心容灾架构部署,使故障恢复进入8秒时代,实现单机分布式一体化,打破分布式和单机的架构边界,实现TP&AP一体化,面向多基础设施。
而在保持可扩展、稳定安全及低成本的核心基础上,OceanBase 也正从AI for DB、DB for AI两个层面尝试与探索。一方面,OceanBase聚焦于通过AI生成SQL语句,优化执行效率,及通过AI助力分布式数据库复杂问题的智能诊断和智能运维,另一方面正在探索通过多模引擎原生支持AI向量索引,打造面向未来的SQL+AI能力。
杨冰表示,OceanBase遵循“一体化架构、极致简约”的产品设计理念。现代企业正从传统数据架构或互联网架构向现代数据架构演进和探索,面对全新的数据管理、处理挑战,各行各业都在向统一技术栈演进,OceanBase致力于构建现代数据架构,简化技术栈服务千行百业。
好文章,需要你的鼓励
山东大学等高校联合研究揭示智能手机AI助手隐私保护能力严重不足。研究团队构建了首个隐私意识评估基准SAPA-Bench,包含7138个真实场景。测试结果显示,即使最佳模型的隐私风险感知能力也仅达67%,多数开源模型仅30%左右。研究发现闭源模型表现优于开源模型,明确提示可显著提升隐私感知能力。
英国研究人员开发出一项名为Fastball的三分钟检测技术,通过脑电图头戴设备分析大脑对图像的识别能力,能够在认知衰退早期发现记忆问题。研究涉及107名参与者,发现该技术可有效识别轻度认知障碍患者的记忆缺陷,比现有诊断工具提前10-20年发现阿尔茨海默病征象。该技术可在家中使用,为早期干预治疗提供可能。
香港理工大学等机构研究团队发现扩散语言模型存在"早期答案收敛"现象:高达99%的问题在推理中途就已得出正确答案,却仍继续无效推理。基于此发现,团队开发了Prophet方法,通过监控AI推理信心动态决定提前停止时机,实现3.4倍推理加速且几乎不损失准确性,为AI文本生成效率优化开辟新方向。