近日在2024 Inclusion·外滩大会上,OceanBase CEO杨冰表示,受时代驱动,现代数据架构需要具备五大特性,分别是可扩展性、开放灵活性、多模融合、实时分析、SQL与AI融合。

杨冰认为,单一、结构化、静态数据架构的时代已经一去不复返。当今的业务由海量复杂的并发数据、动态和静态数据、多种形式的数据以及不同质量和信任程度的数据驱动,同时对数据价值的分析挖掘能力要求愈发凸显,数据库体系的变革正在呼之欲出。
从IT架构而言,SaaS层已经演变为微服务云原生架构,IaaS层也统一到云平台的接口、容器化虚拟化的计算。PaaS层经历了过去几年的升级,也已完成分布式、多租户、云原生的改造。数据库作为PaaS的底层,在上层和下层都发生架构巨变的情况下,亟需搭建现代化的数据架构。
如何探索和实践现代数据架构,是全球行业领军者和专业咨询机构的共同命题。
从全球经验与总结来看,杨冰认为,在全球范围内,对这一问题的探索都呈现出相当的共性,即现代数据架构应有可扩展性,面向海量数据,充分利用分布式高并发、可扩展性和高可用性能力,确保海量数据的可管理性;运维部署开放灵活性,可私有云、混合云、公有云,拥抱多基础设施;应多模融合,消除多数据类型带来的数据孤岛问题,简化技术栈;应实时分析,融合事务处理TP和实时分析AP,在确保数据一致性的前提下,满足实时分析需求;应将SQL和AI融合,提升开发和运行效率,支持智能数据查询分析能力。
为满足现代数据架构的需求,OceanBase持续自研创新,在性能创新、容灾创新、架构创新、数据分析创新、多云原生创新 5 个方面不断探索。刷新TPC-C、TPC-H性能榜,达成三地五中心容灾架构部署,使故障恢复进入8秒时代,实现单机分布式一体化,打破分布式和单机的架构边界,实现TP&AP一体化,面向多基础设施。
而在保持可扩展、稳定安全及低成本的核心基础上,OceanBase 也正从AI for DB、DB for AI两个层面尝试与探索。一方面,OceanBase聚焦于通过AI生成SQL语句,优化执行效率,及通过AI助力分布式数据库复杂问题的智能诊断和智能运维,另一方面正在探索通过多模引擎原生支持AI向量索引,打造面向未来的SQL+AI能力。
杨冰表示,OceanBase遵循“一体化架构、极致简约”的产品设计理念。现代企业正从传统数据架构或互联网架构向现代数据架构演进和探索,面对全新的数据管理、处理挑战,各行各业都在向统一技术栈演进,OceanBase致力于构建现代数据架构,简化技术栈服务千行百业。
好文章,需要你的鼓励
来自北京大学多媒体信息处理国家重点实验室和小鹏汽车的研究团队发布了一项重要研究成果,提出了一种名为FastDriveVLA的创新框架,让自动驾驶AI能够像人类司机一样,学会在纷繁复杂的道路场景中快速识别并聚焦于真正重要的视觉信息。
清华团队开发DKT模型,利用视频扩散AI技术成功解决透明物体深度估计难题。该研究创建了首个透明物体视频数据集TransPhy3D,通过改造预训练视频生成模型,实现了准确的透明物体深度和法向量估计。在机器人抓取实验中,DKT将成功率提升至73%,为智能系统处理复杂视觉场景开辟新路径。
TechCrunch年度创业战场大赛从数千份申请中筛选出200强,其中20强进入决赛角逐10万美元大奖。本次消费科技和教育科技领域共有26家公司入选,涵盖无障碍出行、AI视频制作、服装租赁、护肤推荐、纹身预约等创新应用,以及AI语言学习、个性化数学教育、职场沟通培训等教育科技解决方案,展现了科技创新在日常生活和教育领域的广泛应用前景。
字节跳动研究团队提出了专家-路由器耦合损失方法,解决混合专家模型中路由器无法准确理解专家能力的问题。该方法通过让每个专家对其代表性任务产生最强响应,同时确保代表性任务在对应专家处获得最佳处理,建立了专家与路由器的紧密联系。实验表明该方法显著提升了从30亿到150亿参数模型的性能,训练开销仅增加0.2%-0.8%,为混合专家模型优化提供了高效实用的解决方案。