开源数据库 MariaDB 现已推出向量搜索功能,使客户能够通过单一完整的数据库同时支持事务处理、分析、半结构化数据以及人工智能应用。
该公司自 2022 年以 6.72 亿美元估值上市后经历了私募股权重组。期间经历了季度业绩不佳、收到纽交所市值过低警告、裁员 28%、关闭 MariaDB Xpand 和 MariaDB SkySQL 服务,并宣布 Azure Database for MariaDB 将于 2025 年 9 月关闭。在这场财务风暴中,甚至有贷款方威胁要清空其账户。公司收到多个收购提议,最终接受了 K1 Investment Management 以 3700 万美元估值的收购要约。
因此,拥有近 700 个活跃客户(涵盖银行、电信、政府、医疗保健和电子商务等行业)的 MariaDB 于 2024 年 9 月私有化。当时,K1 运营董事总经理 Sujit Banerjee 表示:"我们将共同加速产品创新,继续履行 MariaDB 提供高质量企业级解决方案以满足市场日益增长需求的使命。" K1 任命 Rohit de Souza 为 CEO,而前任 CEO Paul O'Brien 则继续担任顾问。
在高管补充方面,MariaDB 重新聘请了 MySQL 创始人 Michael "Monty" Widenius 担任 CTO。他此前曾在 Maria 担任 CTO 长达 7 年,直至 2022 年 12 月。公司还任命 Vikas Mathur 为首席产品官,Mike Mooney 为首席营收官。公司宣布将在 MariaDB Server 中推出向量搜索功能和 Kubernetes (K8s) 运营商,以适应 AI 和云原生趋势,现在这一承诺已经实现。
MariaDB Enterprise Platform 2025 版本提供以下功能: - 在 100% 开源的核心数据库引擎中内置原生向量搜索功能 - 增强的 JSON 功能,扩展半结构化数据支持 - 全新版本的 MaxScale,实现无忧升级 - 新的基于成本的优化器,支持复杂查询
Vikas Mathur 表示:"在数据库服务器中原生集成向量搜索功能,让客户能够将其组织中已在使用的数据库扩展到新的 AI 应用。在此版本中,我们还优先考虑了企业客户的使用体验,添加了使版本升级变得轻松的工具。"
该公司表示,向量搜索使企业能够在支持 AI 计划的同时保持数据库架构简单。MariaDB 称,向量搜索可以按值和语义搜索非结构化数据,无需集成多个数据库或影响系统的可靠性和安全性。它还可以帮助大语言模型使用企业数据的检索增强生成 (RAG) 功能,提供更准确和更具上下文相关性的结果。
此外,通过利用现有的 MariaDB 数据库,客户可以消除维护单独向量数据库的需求。
MariaDB 的向量搜索性能基准测试显示,其每秒查询量 (QPS) 比 PostgreSQL 的 pgvector 快 1.5 倍,索引创建时间快 2 倍。
新的 MaxScale 功能允许客户捕获生产系统的工作负载(如查询、会话和事务),并在测试环境中重放。捕获的工作负载可用于验证 MariaDB 数据库升级是否按预期运行,并衡量配置更改可能产生的影响。
数据库引擎中改进的优化器采用了精细的成本模型,考虑了最新的 SSD 磁盘和不同存储引擎的特性。MariaDB 数据库现在可以"充分利用现代存储设备提供的低延迟和高吞吐量,自动为复杂查询选择最快的执行计划。"
新版本还增加了: - 在线架构更改功能,允许内置非锁定 ALTER TABLE,在运行 ALTER TABLE 时可以写入表,从而减少运营停机时间 - 针对复制的新型乐观 ALTER TABLE,通过将 ALTER TABLE 操作转为两阶段操作,大大减少复制延迟 - 增强的企业级保护,新的安全功能默认启用 TLS 加密,增加更细粒度的权限,并引入新插件防止重用旧密码 - 改进的分区管理,新增将分区转换为表(反之亦然)等操作,以及对系统版本控制分区管理的新增强功能,使数据库维护更灵活高效
MariaDB Enterprise Platform 2025 包括其核心数据库 MariaDB Enterprise Server 11.4、高级数据库代理 MariaDB MaxScale 25.01 的更新版本,以及工具和支持。MariaDB Enterprise Platform 现已向所有 MariaDB 客户开放下载。
好文章,需要你的鼓励
这项研究由德累斯顿工业大学等机构的研究团队完成,旨在解决主动学习未被广泛应用的问题。研究者构建了包含460万种超参数组合的实验网格,系统分析了各参数对主动学习性能的影响。研究发现,不同策略实现间存在显著差异,基于边缘的不确定性策略整体表现最佳,随机选择约4000个超参数组合即可获得可靠结果。这些发现为设计可重现、可信赖的主动学习实验提供了明确指导,有助于降低入门门槛,促进技术在实际应用中的普及。
这项由英国爱丁堡大学和上海人工智能实验室研究者共同完成的工作提出了LongBioBench,一种用于评估长文本语言模型的新型基准测试框架。通过使用人工生成的虚构人物传记作为测试环境,该框架在保持可控性的同时,提供了更真实的评估场景。研究对18个长文本模型的测试表明,即使最先进的模型在检索、推理和可信任性方面仍存在显著挑战,特别是上下文长度增加时。研究还揭示了现有合成基准测试的设计缺陷和长上下文预训练的局限性,为未来模型开发提供了重要指导。
SuperWriter是一项来自新加坡科技设计大学和清华大学的突破性研究,通过模仿人类"先思考后写作"的过程,彻底改良了AI长文生成能力。该研究团队开发的框架包含三个关键阶段:规划、写作和修改,使AI能像专业作家一样进行结构化思考。实验结果表明,经过训练的SuperWriter-LM模型不仅超越同等规模的所有AI模型,甚至在某些领域表现优于规模更大的顶级模型,为AI辅助写作开创了新的可能性。
香港大学与阿里巴巴达摩院合作开发的LayerFlow是一种突破性的层级视频生成技术,能同时生成透明前景、完整背景和混合场景视频。该技术通过创新的框架设计将不同视频层级作为子片段连接,并引入层级嵌入使模型区分各层级。面对高质量训练数据稀缺的挑战,研究团队设计了三阶段训练策略,结合Motion LoRA和Content LoRA,实现了图像和视频数据的联合训练。LayerFlow不仅支持多层视频生成,还能实现视频分解和条件层生成,为视频创作领域带来革命性变革。