NASA 的人力分析团队因成本问题,将原使用近十年的 Neo4j 图数据库换成 Memgraph。
团队高级数据科学家 David Meza 在最近的网络研讨会上表示,尽管他们使用 Neo4j 已经近十年,但成本问题日益突出。
Meza 曾在接受 The Register 采访时谈到,使用 Neo4j 图数据库系统的好处在于能整合 NASA 各企业应用中的数据,从而理解知识、技能、能力、任务与技术 ( KSATTs ) 与职业、角色及培训之间的关系。
但在最近关于 Memgraph 的网络研讨会上,他解释了转向这种基于内存的图数据库的原因。
他说:“使用 Neo4j 最大的问题是成本太高,我当前的环境承受不起这个费用。”
上周,特朗普政府提议将 NASA 的年度预算由 248 亿美元削减 24%,降至 188 亿美元,以削减政府开支。
Memgraph 同样使用与 Neo4j 相同的 Cypher 查询语言。不过,它使用 C++ 编写,并且与 Python 的集成效果优于采用 Java 构建应用的 Neo4j。
他表示:“它有很多优点。我们可以使用相同的工具而无需重新学习大量内容,因为我们在 Neo4j 上已经积累了大量经验。而后,Memgraph 展示了其成本优势,这促使我做出了这个决定。这不仅是出于成本考量,更因为转换过程十分便捷。”
NASA 正将 Memgraph 整合进其人力资本智能查询系统,以便为员工更快地检索相关信息。Meza 在一份声明中表示:“它基于图的数据结构使我们能够实时跟踪更新,确保各项政策文件和数据源之间的精确关联。通过将 Memgraph 融入到我们的检索增强生成过程中,我们提升了系统响应速度,并能更好地处理 NASA 的知识提取任务,同时无需进行大量手动数据协调。”
在接受 The Register 采访时,Memgraph 首席执行官 Dominik Tomicevic 表示,Neo4j 依赖于基于磁盘的复杂 B-tree 结构,并辅以内存缓存。“因此,为了运行图算法,需要在图中进行大量的随机跳转。”
由于磁盘设计用于顺序读取而非随机读取,所以其解决方案是复制数据,从只读格式中运行分析工作负载,并在需要时将结果写回原始数据。
Tomicevic 说道:“虽然在使用 Neo4j 时可以完成许多任务,尤其是在处理批量工作负载时,但如果需要实时作出决策,那么重建内存索引、重复所有数据、运行算法再将数据写回原始图形的成本将会大大增加。”
他还指出,在 Memgraph 中,数据结构首先为数据科学工作负载而构建。借助 snapshots ( snapshots ),这一内存系统不仅支持事务性工作负载,还能满足实时分析需求。
好文章,需要你的鼓励
AWS通过升级SageMaker机器学习平台来扩展市场地位,新增观测能力、连接式编码环境和GPU集群性能管理功能。面对谷歌和微软的激烈竞争,AWS专注于为企业提供AI基础设施支撑。SageMaker新功能包括深入洞察模型性能下降原因、为开发者提供更多计算资源控制权,以及支持本地IDE连接部署。这些更新主要源于客户需求,旨在解决AI模型开发中的实际问题。
南洋理工大学研究团队开发了WorldMem框架,首次让AI拥有真正的长期记忆能力,解决了虚拟世界模拟中的一致性问题。该系统通过记忆银行存储历史场景,并使用智能检索机制,让AI能准确重现之前的场景和事件,即使间隔很长时间。实验显示在Minecraft和真实场景中都表现出色,为游戏、自动驾驶、机器人等领域带来广阔应用前景。
AI虽具备变革企业洞察力的潜力,但成功依赖于数据质量。大多数AI项目失败源于数据混乱分散而非算法局限。谷歌BigQuery云数据AI平台打破数据孤岛,简化治理,加速企业AI应用。通过AI自动化数据处理,实现实时分析,并与Vertex AI深度集成,使企业能够高效处理结构化和非结构化数据,将智能商业转型从愿景变为现实。
MTS AI研究团队提出RewardRanker系统,通过重排序模型和迭代自训练显著提升AI代码生成质量。该方法让13.4B参数模型超越33B大模型,在多种编程语言上表现优异,甚至在C++上超越GPT-4。通过引入困难负样本和PPO优化,系统能从多个代码候选中选出最优方案,为AI编程助手的实用化奠定基础。