近日在2024 Inclusion·外滩大会上,OceanBase CEO杨冰表示,受时代驱动,现代数据架构需要具备五大特性,分别是可扩展性、开放灵活性、多模融合、实时分析、SQL与AI融合。
杨冰认为,单一、结构化、静态数据架构的时代已经一去不复返。当今的业务由海量复杂的并发数据、动态和静态数据、多种形式的数据以及不同质量和信任程度的数据驱动,同时对数据价值的分析挖掘能力要求愈发凸显,数据库体系的变革正在呼之欲出。
从IT架构而言,SaaS层已经演变为微服务云原生架构,IaaS层也统一到云平台的接口、容器化虚拟化的计算。PaaS层经历了过去几年的升级,也已完成分布式、多租户、云原生的改造。数据库作为PaaS的底层,在上层和下层都发生架构巨变的情况下,亟需搭建现代化的数据架构。
如何探索和实践现代数据架构,是全球行业领军者和专业咨询机构的共同命题。
从全球经验与总结来看,杨冰认为,在全球范围内,对这一问题的探索都呈现出相当的共性,即现代数据架构应有可扩展性,面向海量数据,充分利用分布式高并发、可扩展性和高可用性能力,确保海量数据的可管理性;运维部署开放灵活性,可私有云、混合云、公有云,拥抱多基础设施;应多模融合,消除多数据类型带来的数据孤岛问题,简化技术栈;应实时分析,融合事务处理TP和实时分析AP,在确保数据一致性的前提下,满足实时分析需求;应将SQL和AI融合,提升开发和运行效率,支持智能数据查询分析能力。
为满足现代数据架构的需求,OceanBase持续自研创新,在性能创新、容灾创新、架构创新、数据分析创新、多云原生创新 5 个方面不断探索。刷新TPC-C、TPC-H性能榜,达成三地五中心容灾架构部署,使故障恢复进入8秒时代,实现单机分布式一体化,打破分布式和单机的架构边界,实现TP&AP一体化,面向多基础设施。
而在保持可扩展、稳定安全及低成本的核心基础上,OceanBase 也正从AI for DB、DB for AI两个层面尝试与探索。一方面,OceanBase聚焦于通过AI生成SQL语句,优化执行效率,及通过AI助力分布式数据库复杂问题的智能诊断和智能运维,另一方面正在探索通过多模引擎原生支持AI向量索引,打造面向未来的SQL+AI能力。
杨冰表示,OceanBase遵循“一体化架构、极致简约”的产品设计理念。现代企业正从传统数据架构或互联网架构向现代数据架构演进和探索,面对全新的数据管理、处理挑战,各行各业都在向统一技术栈演进,OceanBase致力于构建现代数据架构,简化技术栈服务千行百业。
好文章,需要你的鼓励
前谷歌资深工程师David Petrou创立的AI初创公司Continua宣布完成800万美元种子轮融资,由GV领投。该公司开发AI智能体技术,可加入SMS、iMessage和Discord等群聊平台,为用户协作提供智能支持。Continua能够在群聊中自动设置提醒、发起投票、添加日历邀请或生成待办清单,解决群聊混乱问题。公司通过微调技术让AI理解群聊动态,具备社交智能,只在需要时提供帮助。
艾伦人工智能研究院开发的MolmoAct是首个开源的机器人空间推理模型,通过"看懂-规划-执行"三步思考法让机器人具备类人的空间理解能力。它不仅在多项基准测试中表现优异,还支持直观的视觉轨迹调教,用户可直接在屏幕上画线指导机器人行为。研究团队完全开源了模型、代码和数据集,为全球机器人研究提供强大基础平台。
Anthropic宣布为企业客户增加Claude单次提示词的信息处理量,以吸引更多开发者使用其AI编程模型。Claude Sonnet 4现支持100万token上下文窗口,可处理75万词或7.5万行代码的请求,是此前限制的5倍,超过OpenAI GPT-5的40万token。该功能也将通过Amazon Bedrock和Google Cloud等云合作伙伴提供。更大的上下文窗口有助于AI模型更好地处理软件工程问题和长期自主编程任务。
这项由北京大学和清华大学联合完成的研究首次提出时间自奖励语言模型,通过"锚定拒绝"和"未来引导选择"策略解决了AI自学习中的梯度消失问题。该方法让AI既能从过去的低水平样本中学习反面教材,又能向未来的高水平样本学习正面目标,成功维持了清晰的学习对比信号,在多个基准测试中显著优于传统自奖励方法。