Red Hat帮助美国能源部超级三大国家实验室开启高性能计算容器化

云原生架构改变了应用的部署方式，但对于高性能计算来说仍然是一个相对未知的领域。不过据报道，接下来Red Hat和美国能源部将在这个领域采取一些行动。

IBM子公司Red Hat与美国劳伦斯伯克利国家实验室、劳伦斯利弗莫尔国家实验室以及桑迪亚国家实验室展开紧密合作，开发新一代的高性能计算应用，这些应用可以运行在容器中，可以使用Kubernetes进行编排，并针对分布式文件系统进行了优化。此举还将让企业更容易部署AI/ML工作负载。

虽然Kubernetes、容器化和块存储在超大规模和云数据中心中都是老生常谈，但这些技术尚未在高性能计算环境中得到大规模的部署。高性能计算环境一直都是高度专业化的，用于满足工作负载特定要求的。

桑迪亚国家实验室研发经理Andrew Younge表示：“我们的工作负载与云非常不同，我们需要运行一项非常大的任务，并将其分布到数十个、数百个、数千个单独的CPU上，这是一种一对多的映射。”

相比之下，云提供商则主要关注的是可用性和容量。换句话说，如何使应用规模化来满足快速变化的使用和流量模式的需求。

“考虑到这一点，我们正在尝试……在高性能计算环境中使用云原生技术，这需要一些定制，”Younge解释说。

他补充说，容器化在高性能计算领域并不是陌生，但是经常被部署在专有的运行时中。

“可以采用更多的标准技术，就意味着我们就可以开始利用生态系统了，”劳伦斯伯克利国家实验室的高级工程师Shane Canon这样表示。

“我们希望能够运行我们的高性能计算工作负载，但也希望可以与Kubernetes风格的部署、配置和执行结合起来。”

Red Hat将目光投向高性能计算容器化

Red Hat公司新兴技术全球布道师Yan Fisher表示：“如果你从总体上看容器化的话，会发现我们一直关注容器的应用价值，更多的是基础设施应用。”

为了应对这些挑战，Red Hat正在与这些实验室展开合作，将云原生技术集成到高性能计算工作流中，并为其提供支持。

在伯克利国家实验室，Red Hat正在与Canon合作对Podman进行改进，这是一种类似于Docker的无守护程序容器引擎，以取代国家能源研究科学计算中心的自定义Shifter开发运行时。

同样地，在桑迪亚国家实验室，Red Hat正在与Younge的团队合作，探索使用OpenShift平台在Kubernetes上大规模部署工作负载。

“就Kubernetes而言，拥有这种灵活性可以带来很多价值。我们通常会将一切都表示为一项任务，这有时会受到限制。但是，将服务和任务两者融合，确实提供了一个全面的科学生态系统。”

与此同时，在劳伦斯利弗莫尔国家实验室，Red Hat正致力于帮助研究人员部署和管理容器化工作负载以及传统的高性能计算应用。

所有这三个实验室都在研究如何在分布式文件系统中部署这些工作负载，取代当前使用专用并行文件系统的方法。

最终目标是让高性能计算工作负载能够“超大规模”地部署在Kubernetes上，同时为用户提供易于理解的部署方式。

“其中很多，尤其是Podman，是为了确保我们在高性能计算中获得的经验可以推广到更广泛的领域。”

这项工作带来的好处将远远超出科学领域。他补充说，在容器或者Kubernetes上能够轻松部署高性能计算工作负载，这将对那些争相部署AI/ML等大型并行工作负载的企业带来影响。

来源：至顶网软件与服务频道

0赞

好文章，需要你的鼓励

人工智能

数据安全

融资估值

2026-01-09

Cyera获得4亿美元融资专攻AI数据安全，估值达90亿美元

人工智能和数据安全公司Cyera宣布完成4亿美元后期融资，估值达90亿美元。此轮F轮融资由贝莱德领投，距离上次融资仅6个月。随着95%的美国企业使用生成式AI，AI应用快速普及带来新的安全挑战。Cyera将数据安全态势管理、数据丢失防护和身份管理整合为单一平台，今年推出AI Guardian扩展AI安全功能。

人工智能

强化学习

模型优化

2026-01-08

上海AI实验室研究者想出妙招：让AI像优秀学生一样高效思考，告别“想太多“毛病

上海AI实验室开发RePro训练方法，通过将AI推理过程类比为优化问题，教会AI避免过度思考。该方法通过评估推理步骤的进步幅度和稳定性，显著提升了模型在数学、科学和编程任务上的表现，准确率提升5-6个百分点，同时大幅减少无效推理，为高效AI系统发展提供新思路。

人工智能

零售科技

AI助手

2026-01-09

SAP推出全新AI功能助力零售业数字化转型

SAP在2026年全国零售联盟大展上发布了一系列新的人工智能功能，将规划、运营、履约和商务更紧密地集成到其零售软件组合中。这些更新旨在帮助零售商管理日益复杂的运营，应对客户参与向AI驱动发现和自动化决策的转变。新功能涵盖数据分析、商品销售、促销、客户参与和订单管理等领域，大部分功能计划在2026年上半年推出。

机器人技术

异步推理

视觉语言动作模型

2026-01-08

MIT团队让机器人终于不再“卡顿“：一种让机器人像人一样流畅反应的突破性技术

MIT团队开发的VLASH技术首次解决了机器人动作断续、反应迟缓的根本问题。通过"未来状态感知"让机器人边执行边思考，实现了最高2.03倍的速度提升和17.4倍的反应延迟改善，成功展示了机器人打乒乓球等高难度任务，为机器人在动态环境中的应用开辟了新可能性。

Red Hat帮助美国能源部超级三大国家实验室开启高性能计算容器化

来源：至顶网软件与服务频道

2022

06/06

10:14

分享

点赞

SAP推出全新AI功能助力零售业数字化转型

Gmail推出个性化AI收件箱与智能搜索等多项新功能

CISA警告HPE OneView和微软Office漏洞正被活跃利用

谷歌削减Android开源代码发布频率至每年两次

高通CES 2026：扩展IE-IoT产品组合推进边缘AI发展

恩智浦发布S32N7处理器系列，加速AI驱动汽车发展

n8n自动化平台严重漏洞可让攻击者完全控制服务器

微软将在Copilot中直接集成购买按钮功能

Snowflake收购Observe拓展AI驱动监控能力

丰田升级SUV产品线，RAV4新增信息娱乐系统

可信开源软件现状报告：AI重塑技术栈基线

思科修复ISE安全漏洞，公开概念验证代码已发布

VDURA 推出 V5000 全闪存节点，提升海量数据访问速度

VDURA 展示面向能源行业的节能高性能计算系统

AI PC 之争：Microsoft 的 NPU 执念与 Nvidia 的 AI PC 野心

DDN 获3亿美元投资，矢志成为 AI 存储领导者

Gartner：中国企业优化云原生投资的三大策略

Panmnesia 凭借 GPU CXL 内存扩展技术获奖

AMD 追随 NVIDIA 进军 AI 药物研发领域

新加坡大学借助 Xinnor 存储平台提升 AI 研究能力

红帽详述企业AI发展愿景，欲借Granite奠定基础

爱立信推出紧凑型分组核心网，简化 5G 现代化网络

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: