定义新一代云原生向量数据库，Milvus 2.0 GA

全新的Milvus向量数据库具备支持大规模生产环境的能力，帮助开发者在构建深度学习、机器视觉、语义学习等大规模系统时，能够快速构建起高可靠、高性能、高检索效率、运维管理友好的向量数据（embedding vector）处理平台。

近日，获得 AI 开发者广泛关注（Github star 数 9000+）的“AI 神鸟项目” Milvus 向量数据库（Milvus 在英文中指鸢），正式宣布2.0 版本的 GA。全新的 Milvus 向量数据库具备支持大规模生产环境的能力，帮助开发者在构建深度学习、机器视觉、语义学习等大规模系统时，能够快速构建起高可靠、高性能、高检索效率、运维管理友好的向量数据（embedding vector）处理平台。

“这不是一次简单的版本升级，而是一次全面重构，也是我们过去三年在向量数据库领域探索之后的集大成之作。在经过对架构进行全面重新设计，及 9 个 RC 版本的迭代后，我们正式宣布 Milvus 2.0 的 GA。 Milvus 的用户将由此能够获得生产级可用的开源向量数据库系统，它可以部署在任意云基础设施上，使用更加便利，性能更加强大，整体成本也更为优化。”Milvus 工程总监栾小凡如此描述此次 GA 对 Milvus 项目的意义。

“我们在迭代了 19 个版本后发布了 Milvus 的 1.0 版本，并获得了全球近 1000 家用户的实践验证。但我们依然看到了它的很多局限性，比如实时性与效率的冲突，成本的高昂，可扩展性和弹性的不足。于是我们开始了 2.0 版本的重构。” 栾小凡提及的这些局限，充分说明目前 AI 系统开发者在面对生产落地时，在算法和模型之外，也同样面临更为切实的权衡：

非结构化数据相比传统结构化数据，已经占据压倒性地位；
数据新鲜度非常重要，数据科学家们更希望能够拥有实时处理能力，而非忍受对 T+1 的妥协；
面对生产实践环境，数据处理的成本和性能更加重要，但现有的方案却仍然与需求存在距离；
数据平台能够自如的部署在各种云基础设施之上，全面云原生化势在必行。

的确，随着 AI 应用的大规模快速普及，一套 AI 系统需要应对的业务数据量呈几何级数增长。这其中以图形、视频、音频为代表的非结构化数据为主。目前业务处理这类非结构化数据的主流的做法是将数据通过算法先转化成向量（embedding vector），之后通过向量数据库平台进行向量近似性搜索，以实现对这些数据的搜索查询等需求。在最近的人工智能顶会 NeurIPS 上，Google、Facebook 及 Microsoft 的 AI 团队向业界公开了数个全新的 10 亿级向量数据包，而这些数据全部基于真实的业务场景产生。面对这些这些真正意义上的“大规模”并且仍在高速增长的海量数据，是否有更好的向量数据库解决方案，能在更高的效率、更好的成本收益比，更稳定可靠的平台支持，更方便的运维管理之间取得取舍均衡，是业界的焦点所在。

Milvus 2.0 正是为应对这种大规模生产级场景而设计的向量数据库系统，综合考虑了架构稳定性、工程可靠性、性能、成本、功能、用户体验等多种因素，并全面拥抱云原生技术。

Milvus 2.0 围绕三个理念，重新定义了新一代云原生向量数据库：

云原生优先：存储计算分离的架构更能发挥云的弹性，以实现按需扩容的模式。而 Milvus 2.0 采取了读写分离、实时离线分离、计算瓶颈/内存瓶颈/IO瓶颈分离的微服务化设计模式，这有助于面对复杂的工作负载选择最佳的资源配比。
日志即数据：Milvus 2.0 引入消息存储作为系统的骨架，数据的插入修改只通过消息存储交互，执行节点通过订阅消息流来执行数据库的增删改查操作。这一设计的优势在于降低了系统的复杂度，将数据库关键的持久化和闪回等能力都下钻到存储层；另一方面，日志订阅机制提供了极大的灵活性，为系统未来的拓展奠定了基础。
批流一体：Milvus 2.0 实现了 unified Lambda 流式处理架构，增量数据和离线数据一体化处理。相比 Kappa 架构，Milvus 引入对日志流的批量计算将日志快照和构建索引存入对象存储，这大大提高了故障恢复速度和查询效率。为了将无界的流式数据拆分成有界的窗口，Milvus 采用 watermark 机制，通过写入时间（也可以是事件发生时间）将数据切分为多个小的处理单元，并维护了一条时间轴便于用户基于某个时间点进行查询。

定义新一代云原生向量数据库，Milvus 2.0 GA

Milvus 2.0 架构概览

基于上述的理念及架构设计，Milvus 2.0 可以支持： 百亿规模的向量数据扩展能力，增量数据毫秒级实时可见的数据可见性，存储计算的秒级扩缩容能力，10 毫秒级查询延时性能，分钟级的故障恢复能力，动态负载均衡能力；提供完善的面向向量数据的增删改查功能，数据压缩压缩功能，动态加载索引功能，及图形化 GUI 及命令行管理工具，提供 PyMilvus、Node.js、Java and Go 等多语言语言 SDK。目前，Milvus 2.0 无论在性能、功能、稳定性、可扩展性及易用性方面，均到达业绩领先水平，重新定义了向量数据库的标杆。

“基于大数据 + AI 的应用架构依然过于复杂，简化非结构化数据处理一直是 Milvus 社区努力的方向。” 谈及 Milvus 项目未来的发展路线图时，栾小凡这样表示。接下来的 Milvus 项目会重点关注以下几个方向：

DB for AI：作为一款数据库，除了基本的 CRUD 功能之外，Milvus 必然还需要更强大的数据查询能力、更智能的查询优化器、更全的数据管理功能等。下一阶段将重点补齐 Milvus 2.0 目前还不支持的 DML 功能和数据类型，比如删除、更新操作和支持 string 数据类型。
AI for DB：向量索引类型、索引参数、用户工作负载、硬件类型、成本性能等的约束构成了一个非常庞大的 tradeoff，尽可能避免手动调优有助于降低使用复杂度。我们已经着手分析系统负载，收集访问热度的数据，后续将引入自动参数调优工作以降低用户的理解成本。
成本优化：向量召回的最大挑战是需要在限定时间内处理海量数据，这项工作既是计算密集型，也是访存密集型。在物理执行层引入 GPU、FPGA 等异构硬件加速可以大幅降低 CPU 开销。我们正在开发磁盘内存混合的 ANN 索引算法，可以在有限的内存下实现海量向量的高性能查询。于此同时，我们也在评估开源的 ScaNN、NGT 等向量索引算法的性能。
易用性：Milvus 易用性的提升体现在集群管理工具、多语言 SDK、部署工具、运维工具等许多方面，Milvus 将在这些方向持续迭代完善。同时，Milvus 的设计理念是可以在任何平台运行，在接下来的几个版本更新中， Milvus 将支持 MacOS 系统（M1 芯片及x86 芯片）以及 ARM 架构。

来源：业界供稿

云原生

0赞

好文章，需要你的鼓励

数据中心

电池储能

基础设施投资

2025-10-24

Aligned Data Centers部署“首创“数据中心电池储能项目

阿里纳德数据中心与Calibrant Energy合作开发首创电池储能系统，通过绕过传统电网升级时间线，使俄勒冈州希尔斯伯勒在建数据中心园区提前数年上线。该31兆瓦、62兆瓦时储能系统计划2026年投运，将作为响应电网的动态资产，在需求高峰期放电，增强区域电网可靠性。这标志着美国首次使用专用电池系统加速大型数据中心并网。

威斯康星大学最新研究：AI在“背书“时容易撒谎，LUMINA系统如何识破这些“花言巧语“

人工智能

幻觉检测

信息利用度

2025-10-24

威斯康星大学最新研究：AI在“背书“时容易撒谎，LUMINA系统如何识破这些“花言巧语“

威斯康星大学研究团队开发了LUMINA系统，专门检测AI在回答问题时的"撒谎"行为。该系统发现AI有时会忽视提供的参考资料，固执地依赖内部知识生成不准确回答。LUMINA通过监测AI对外部文档和内部知识的依赖程度来识别这种行为，在多个测试中达到90%以上的准确率，比以往方法提升13%，为构建更可信的AI系统提供了重要工具。

人工智能

智能体技术

浏览器创新

2025-10-24

微软推出Edge浏览器Copilot模式挑战ChatGPT Atlas

微软在Edge浏览器中推出增强版Copilot模式，提供更强大的AI代理功能，目前在美国进行限量预览。该模式包含Actions和Journeys两大功能：Actions让浏览器能代表用户执行任务，如语音控制打开网页或查找文章特定内容；Journeys则记住用户浏览历史，帮助用户继续之前的研究任务。此举正值AI浏览器竞争加剧，OpenAI推出ChatGPT Atlas、Perplexity发布Comet、谷歌集成Gemini到Chrome。目前Chrome占据71%市场份额，Edge仅占4.67%。

定义新一代云原生向量数据库，Milvus 2.0 GA

来源：业界供稿

2022

02/10

10:20

分享

点赞

Aligned Data Centers部署"首创"数据中心电池储能项目

微软推出Edge浏览器Copilot模式挑战ChatGPT Atlas

IBM与客户共谱AI长期发展蓝图

MIT实验室推出sAIpien项目：让董事会能够审计AI决策

AI道德记分卡如何建立人工智能系统信任

Twitch推出AI工具助力主播触达更大受众

SAP称部分客户延迟合同签署影响云收入增长

阿联酋数据中心建设热潮助力AI雄心与数字主权

谷歌宣称量子计算突破可加速药物发现

征服生成式AI成功路上的存储挑战

全球首个 HDR10 AR 眼镜发布！雷鸟 Air 4 重塑口袋电视性能上限

北京大学研究团队突破模拟计算精度极限：让矩阵运算快过超级计算机千倍

Gartner：中国企业优化云原生投资的三大策略

爱立信推出紧凑型分组核心网，简化 5G 现代化网络

超大规模集群：CPU&GPU部署与实践

蚂蚁数科余滨：以AI全面升级云产品 加速迈向AI原生时代

2024开放原子开源生态大会在北京举行

爱立信与土耳其电信完成5G云无线接入网试点部署

安波福展示本地化软硬件解决方案，让“软件定义汽车”照进现实

思科发布 Hypershield 冀加强数据中心和云平台的安全性

移动云时空大数据融合分析平台及应用——中移（苏州）软件技术有限公司

Gartner：利用基础设施平台工程，管理云原生平台

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

阿里要用AI将云计算重做一遍

PEC 2025 AI创新者大会

用AI，在数字身份验证风暴中心重构信任坐标

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

蚂蚁数科余滨：以AI全面升级云产品加速迈向AI原生时代