NASA 的人力分析团队因成本问题,将原使用近十年的 Neo4j 图数据库换成 Memgraph。
团队高级数据科学家 David Meza 在最近的网络研讨会上表示,尽管他们使用 Neo4j 已经近十年,但成本问题日益突出。
Meza 曾在接受 The Register 采访时谈到,使用 Neo4j 图数据库系统的好处在于能整合 NASA 各企业应用中的数据,从而理解知识、技能、能力、任务与技术 ( KSATTs ) 与职业、角色及培训之间的关系。
但在最近关于 Memgraph 的网络研讨会上,他解释了转向这种基于内存的图数据库的原因。
他说:“使用 Neo4j 最大的问题是成本太高,我当前的环境承受不起这个费用。”
上周,特朗普政府提议将 NASA 的年度预算由 248 亿美元削减 24%,降至 188 亿美元,以削减政府开支。
Memgraph 同样使用与 Neo4j 相同的 Cypher 查询语言。不过,它使用 C++ 编写,并且与 Python 的集成效果优于采用 Java 构建应用的 Neo4j。
他表示:“它有很多优点。我们可以使用相同的工具而无需重新学习大量内容,因为我们在 Neo4j 上已经积累了大量经验。而后,Memgraph 展示了其成本优势,这促使我做出了这个决定。这不仅是出于成本考量,更因为转换过程十分便捷。”
NASA 正将 Memgraph 整合进其人力资本智能查询系统,以便为员工更快地检索相关信息。Meza 在一份声明中表示:“它基于图的数据结构使我们能够实时跟踪更新,确保各项政策文件和数据源之间的精确关联。通过将 Memgraph 融入到我们的检索增强生成过程中,我们提升了系统响应速度,并能更好地处理 NASA 的知识提取任务,同时无需进行大量手动数据协调。”
在接受 The Register 采访时,Memgraph 首席执行官 Dominik Tomicevic 表示,Neo4j 依赖于基于磁盘的复杂 B-tree 结构,并辅以内存缓存。“因此,为了运行图算法,需要在图中进行大量的随机跳转。”
由于磁盘设计用于顺序读取而非随机读取,所以其解决方案是复制数据,从只读格式中运行分析工作负载,并在需要时将结果写回原始数据。
Tomicevic 说道:“虽然在使用 Neo4j 时可以完成许多任务,尤其是在处理批量工作负载时,但如果需要实时作出决策,那么重建内存索引、重复所有数据、运行算法再将数据写回原始图形的成本将会大大增加。”
他还指出,在 Memgraph 中,数据结构首先为数据科学工作负载而构建。借助 snapshots ( snapshots ),这一内存系统不仅支持事务性工作负载,还能满足实时分析需求。
好文章,需要你的鼓励
英特尔携手戴尔以及零克云,通过打造“工作站-AI PC-云端”的协同生态,大幅缩短AI部署流程,助力企业快速实现从想法验证到规模化落地。
意大利ISTI研究院推出Patch-ioner零样本图像描述框架,突破传统局限实现任意区域精确描述。系统将图像拆分为小块,通过智能组合生成从单块到整图的统一描述,无需区域标注数据。创新引入轨迹描述任务,用户可用鼠标画线获得对应区域描述。在四大评测任务中全面超越现有方法,为人机交互开辟新模式。
阿联酋阿布扎比人工智能大学发布全新PAN世界模型,超越传统大语言模型局限。该模型具备通用性、交互性和长期一致性,能深度理解几何和物理规律,通过"物理推理"学习真实世界材料行为。PAN采用生成潜在预测架构,可模拟数千个因果一致步骤,支持分支操作模拟多种可能未来。预计12月初公开发布,有望为机器人、自动驾驶等领域提供低成本合成数据生成。
MIT研究团队发现,AI系统无需严格配对的多模态数据也能显著提升性能。他们开发的UML框架通过参数共享让AI从图像、文本、音频等不同类型数据中学习,即使这些数据间没有直接对应关系。实验显示这种方法在图像分类、音频识别等任务上都超越了单模态系统,并能自发发展出跨模态理解能力,为未来AI应用开辟了新路径。