Kioxia 发布开源 AiSAQ 技术,旨在降低生成式 AI 系统中的 DRAM 需求。该技术为 SSD 优化的近似最近邻搜索算法,可直接在 SSD 上搜索,无需将索引数据放入 DRAM,从而实现检索增强生成 (RAG) 的可扩展性能。这一创新有望大幅提升大规模 RAG 应用的性能范围。
微软研究人员提出了一种新的内存技术——管理保留内存 (MRM),旨在解决 AI 基础模型工作负载的存储和 IO 问题。MRM 具有短期数据持久性,可优化 AI 推理性能,同时降低能耗和成本。这一创新概念有望填补现有内存-存储层级中的空白,为 AI 时代的内存技术发展开辟新方向。