近日,浪潮KaiwuDB 与中国人民大学合作的论文 FOSS: A Self-Learned Doctor for Query Optimizer 被数据库领域顶会The 40th IEEE International Conference on Data Engineering (ICDE 2024) 录用。论文提出了具备自学习、自诊断能力的查询优化器 FOSS,推动了基于 AI 算法的学习型查询优化技术革新,其技术创新性获得国际顶会权威认可。浪潮KaiwuDB 高级研发工程师、人大信息学院博士孙路明为共同作者。
ICDE 是电气与电子工程师协会(IEEE)举办的旗舰会议,与 SIGMOD、VLDB 并称数据库三大顶会,也是中国计算机学会 ( CCF ) 推荐的 A 类国际会议,主要聚焦设计、构建、管理和评估高级数据密集型系统和应用等研究问题,在国际上享有盛誉并具有广泛的学术影响力。此次在荷兰召开的ICDE 2024大会,吸引到北京大学、清华大学、中国人民大学、浙江大学、MIT、斯坦福等高校及全球知名科技企业参会,共同探讨数据库、数据处理领域的先进技术问题。
近年来,数据库研究人员提出了多个基于 AI 算法的学习型查询优化器,它们或者通过自下而上的方式从头学习构建查询计划,或者通过提示(Hint)引导或者限制传统优化器的执行计划生成过程。虽然这些方法取得了一些成功,但它们却面临训练效率低下、计划搜索空间有限等方面的挑战。
本篇论文提出了一种基于深度强化学习的查询优化新框架——FOSS。FOSS 的行为类似一个诊疗查询计划的医生,它从传统优化器生成的原始计划开始优化,发现其中的性能问题,并通过一系列优化动作逐步改进计划中的次优节点。与引导传统优化器行为的黑盒方法不同,FOSS 是一个白盒方法,通过优化传统查询优化器生成的计划,更好地利用专家优化知识。此外, FOSS 中还采用了不对称的收益模型来评估两个计划之间的性能差异。为了提高 FOSS 的训练效率,本文将 FOSS 与传统优化器集成以形成一个模拟环境。利用这个模拟环境,FOSS 可以自动快速生成大量高质量的模拟经验,然后从这些经验中学习以提高其优化能力。论文在 Join Order Benchmark, TPC-DS 和 Stack Overflow 等多组数据集和负载上评估了 FOSS 的性能,实验结果表明,FOSS 在模型收敛速度、查询优化效果上优于现有学习型查询优化器,与 PostgreSQL 默认查询优化器相比,更是获得了最高 8.33 倍的加速效果。通过引入该技术,数据库查询性能、响应时间及用户体验或将有效提升,适用于 OLAP、HTAP 等数据密集型场景的查询需求。
作为业内首款分布式、多模融合、支持原生AI 的数据库产品,KaiwuDB 长期致力于为 AIoT 等重点场景提供更丰富的数据运管能力和更卓越的数据库性能,力求不断在 SQL 优化、数据库自治等重点技术上实现突破。未来也将始终坚持以先进技术打磨产品,加速学术研究与产业应用融合,为中国数据库技术创新发展、数据处理效能提升等方面贡献新思路,为政企客户伙伴提供高性能、高可用、易运维的数据服务,助力产业数字化升级与应用创新。
好文章,需要你的鼓励
美国网络安全和基础设施安全局指示联邦机构修补影响思科ASA 5500-X系列防火墙设备的两个零日漏洞CVE-2025-20362和CVE-2025-20333。这些漏洞可绕过VPN身份验证并获取root访问权限,已被黑客积极利用。攻击与国家支持的ArcaneDoor黑客活动有关,黑客通过漏洞安装bootkit恶意软件并操控只读存储器实现持久化。思科已发布补丁,CISA要求机构清点易受攻击系统并在今日前完成修补。
康考迪亚大学研究团队通过对比混合量子-经典神经网络与传统模型在三个基准数据集上的表现,发现量子增强模型在准确率、训练速度和资源效率方面均显著优于传统方法。研究显示混合模型的优势随数据集复杂度提升而增强,在CIFAR100上准确率提升9.44%,训练速度提升5-12倍,且参数更少。该成果为实用化量子增强人工智能铺平道路。
TimeWave是一款功能全面的计时器应用,超越了苹果自带时钟应用的功能。它支持创建流式计时器,让用户可以设置连续的任务计时,帮助专注工作。应用采用简洁的黑白设计,融入了Liquid Glass元素。内置冥想、番茄工作法、20-20-20护眼等多种计时模式,支持实时活动显示和Siri快捷指令。免费版提供基础功能,高级版需付费订阅。
沙特KAUST大学团队开发了专门针对阿拉伯语的AI模型家族"Hala",通过创新的"翻译再调优"技术路线,将高质量英语指令数据转化为450万规模的阿拉伯语语料库,训练出350M到9B参数的多个模型。在阿拉伯语专项测试中,Hala在同规模模型中表现最佳,证明了语言专门化策略的有效性,为阿拉伯语AI发展和其他语言的专门化模型提供了可复制的技术方案。