4月12日,由中国DBA联盟(ACDU)与墨天轮社区联合主办的第十三届数据技术嘉年华(DTC2024)于北京盛大召开。浪潮KaiwuDB CTO魏可伟受邀发表《智创当下,KaiwuDB 从多模到AI的探索实践》主题演讲,向与会者分享浪潮面向AIoT产业领域的现代数据库探索。
图:浪潮KaiwuDB CTO魏可伟做主题分享
近年来,我国物联网(IoT)规模持续增长,带动各领域技术创新向行业应用侧纵深化推进。我国传统工业、能源、交通业的数字化体系相较于金融业启动时间晚、基础能力薄弱,而恰恰这些行业的智能硬件、终端产品渗透最为广泛:单个传感器日增80,000余条、年增5,000万余条的庞大数据量需要高性能、可扩展、强安全、低成本的数据管理系统为底座,向上承托大数据分析、数据资产化、资产服务化等增值应用,以数据驱动生产管理效率提升,赋能行业数智化发展。
魏可伟表示,当今中国乃至全球数据库市场上,从业者习惯于以技术定义数据库产品,例如关系型数据库、OLAP数据库、时序数据库、图数据库、向量数据库等等,用以分门别类地应对不同类型的数据管理诉求;然而现实是,用户最为关心的往往不是某一项技术是否前沿、足够颠覆,而是产品可否提供高效、低成本的数据管理服务与资源。回归用户本位我们发现,单纯以技术定义的数据库产品与IoT领域的数据管理需求并不适配;中国传统工业制造、能源电力等核心系统的数字化转型呼唤一款行业定义的数据库产品,一套专为AIoT场景设计的数据管理方案。
图:AIoT 数据管理需求
KaiwuDB 是一款分布式、多模、支持云边端协同的数据库产品,以AIoT为一大核心场景,提供高性能、高可用、高兼容、高扩展的数据管理服务及能力,旨在以现代数据库架构,与前沿智能化技术的融合创新赋能工业物联网、数字能源、车联网、智慧产业等新兴数字领域,助力我国传统产业从容步入IoT时代。
作为一款行业定义的数据库,KaiwuDB “快人一步”的slogan有了全新的释义:“就地计算”技术赋能时序数据处理性能大幅提升,轻松应对PB级、甚至ZB级时序数据高速写入、复杂查询;主打“面向行业的多模”,将多个不同类型数据库的功能充分融合,实现“一库多用”,大幅简化传统复杂化的运维管理流程;同时提供原生AI的能力,不止着眼于AI4DB、DB4AI技术路线的探索,也关注用户消费AI的能力和体验:“让用户的AI投入有回报”是更为关键的,魏可伟表示。
图:KaiwuDB — “快人一步”的AIoT数据库
伴随千行百业数智化转型的不断深化,我国产业市场规模、业务复杂度、异构数据量级不断催生新的技术领域和产品形态。工业、能源等我国支柱型产业在数字化市场中只是“后入市”,而并非“后进”。KaiwuDB 自诞生之日起即站在用户本位规划产品架构,希望以“AIoT数据库——一款行业定义的数据库”为我国数据库产业发展打开思路,为新兴产业的数据管理提供创新解决方案,切实助力那些暂时未能走在前排的“大航母”企业华丽转身,实现数智化转型升级。
好文章,需要你的鼓励
传统数据工程面临数据质量差、治理不善等挑战,成为AI项目的最大障碍。多智能体AI系统通过协作方式正在彻底改变数据准备、治理和应用模式。Google Cloud基于Gemini大语言模型构建协作生态系统,让不同智能体专门负责数据工程、科学、治理和分析等任务。系统通过分层架构理解组织环境,自主学习历史工作流程,能够预防问题并自动处理重复性任务,大幅提升效率。
中科大团队开发出LongAnimation系统,解决了长动画自动上色中的色彩一致性难题。该系统采用动态全局-局部记忆机制,能够为平均500帧的动画进行稳定上色,性能比现有方法提升35-58%。核心创新包括SketchDiT特征提取器、智能记忆模块和色彩优化机制,可大幅提升动画制作效率。
微软推出Copilot调优功能,让企业通过低代码工具利用自动化微调技术训练企业数据。与基于公开数据的通用AI模型不同,企业需要理解内部数据和流程的专业化模型。Gartner预测专业化GenAI模型市场将在2026年翻倍至25亿美元。这些模型通常基于开源模型构建,部署为小语言模型,提供更好的成本控制和数据安全性,同时更易符合欧盟AI法案要求。
南开大学团队开发出DepthAnything-AC模型,解决了现有AI距离估算系统在恶劣天气和复杂光照条件下性能下降的问题。通过创新的扰动一致性训练框架和空间距离约束机制,该模型仅用54万张图片就实现了在雨雪、雾霾、夜晚等复杂环境下的稳定距离判断,同时保持正常条件下的优秀性能,为自动驾驶和机器人导航等应用提供了重要技术支撑。