红帽AI 3.4发布：重大升级打通开发运维协作链路，赋能智能体未来

全球领先的企业级开源解决方案提供商红帽近日宣布，对红帽AI产品组合进行重大升级，旨在帮助企业弥合AI实验与生产级运维控制之间的鸿沟。

全球领先的企业级开源解决方案提供商红帽近日宣布，对红帽AI产品组合进行重大升级，旨在帮助企业弥合AI实验与生产级运维控制之间的鸿沟。通过推出从底层硬件到智能体（metal-to-agent）的统一平台，红帽AI 3.4简化了智能体工作流（agentic workflows）的开发与部署，帮助企业从试点项目迈向可覆盖其整个基础设施的可扩展AI应用。

通过为开发者与运维人员提供统一框架，红帽为企业扩展自主系统提供了基础平台，并同时确保了现代企业所需的控制力、安全能力与硬件效率。

什么是红帽AI 3.4？

红帽AI 3.4是一个综合性平台，提供在混合云环境中扩展模型与智能体工作流必需的架构基础与运维工具。此次发布的核心能力是模型即服务（MaaS），可为开发者提供受治理的统一接口，支持其访问各个精选模型，同时也支持管理员跟踪模型使用情况并实施策略控制。该能力构建于高性能分布式推理基础平台之上，由vLLM与llm-d驱动，从而支持模型服务在广泛环境中的优化、高效运行。

随着AI智能体推动推理需求呈指数级增长，红帽AI为企业提供了与智能体框架无关的大规模部署与管理能力。新推出的AgentOps工具可覆盖从开发到生产的智能体全程管理，包括集成式追踪、可观测性、加密身份与生命周期管理等能力。

为实现企业数据与模型、智能体的深度融合，红帽AI 3.4还新增提示词（prompt）管理能力，将提示词作为一级数据资产（first-class data assets）管理，同时推出评估中心，用于评估模型与智能体的准确率、质量与安全性。上述能力由MLflow提供支持，可为生成式AI与预测式AI场景，提供集成式实验追踪以及产物（artifact）管理功能。此外，该平台还使用Chatterbox Labs和Garak项目的技术，通过面向模型与智能体的自动化安全测试与红队测试能力，助力用户验证其安全性，为从实验性试点到生产就绪的企业级应用，提供一条以安全为先的实施路径。

为什么重要？

从实验性聊天机器人向生产级自主系统转型，需要IT团队之间的协作方式进行根本性转变。如今，许多企业已经意识到，为了更好地控制成本和支持私有AI与主权AI场景，需要从单纯的Token消费者转变为Token提供者。然而，开发团队与基础设施管理团队之间的协作摩擦，依然是相关技术模式落地的主要障碍之一。如果缺乏一种能够协调这两个角色的统一方法，基础设施访问受限会拖慢创新速度，而影子AI的捷径则会带来不受管控的风险与不可预测的成本。

红帽AI 3.4面向可扩展推理与自主智能体部署，推出企业基础平台，帮助缓解这一矛盾，提供了满足严格风险与治理标准所需的透明度与控制力。由于智能体具备一定独立性，对其决策过程缺乏可见性可能带来重大安全风险。对此，红帽AI提供的基础设施可以追踪操作、推理步骤、工具调用，使企业能够审计智能体的决策路径。同时，平台通过加密身份管理，将操作行为与已验证身份相关联，帮助企业识别执行相关任务的实体。这些能力将共同助力企业超越孤立的试点阶段，将AI作为一种可扩展、可预测且最重要的是可追责的企业级工具。

红帽及其合作伙伴的观点

红帽AI业务部副总裁兼总经理Joe Fernandes表示：“智能体时代意味着，我们的平台正在演进，从运行传统应用转向驱动智能自主系统。我们正在定义企业运行AI的开放标准。通过为AI推理、模型即服务、AgentOps提供从底层硬件到智能体的强化型基础平台，红帽为企业提供了所需的运维保障，使其能够在保持严格控制的同时实现大规模创新。”

CoreWeave AI服务产品管理副总裁Urvashi Chowdhary表示：“CoreWeave与红帽的合作，根植于双方对开放理念的共同坚守，旨在打造高性能推理基础平台，助力企业扩展其最复杂的AI工作负载。双方共同推出了基于CoreWeave Kubernetes Service的红帽AI推理部署蓝图，支持在本地和云端运行相同的推理堆栈，并具备Kubernetes原生的控制与生产级性能。这让受监管行业的企业AI团队能够专注于构建和扩展AI的重要工作，而无需为每个新环境重新调整其堆栈。”

NVIDIA企业软件副总裁John Fanelli表示：“企业中自主化、长期运行的智能体，需要更高水平的基础设施控制与安全保障能力，以确保大规模场景下的可信运行。红帽和NVIDIA AI工厂提供了开源驱动的统一基础平台，为开发者与运维人员提供了迈向智能体未来必需的治理能力与可靠性。”

主要亮点

可扩展的高性能推理，与受治理模型访问相结合：高效模型推理仍是生产就绪型AI的核心。通过将vLLM推理服务器和llm-d分布式推理引擎与MaaS相结合，红帽AI 3.4为模型推理提供了可靠且高性能的基础平台，同时简化了用户和智能体对模型的受治理访问。
简化AgentOps，面向自主应用生命周期：红帽AI 3.4版本新增全面的AgentOps能力，助力规模化智能体运维。功能涵盖集成式追踪、可观测性和评估功能，同时提供智能体身份管理及生命周期管理，从而推动智能体从开发到生产的顺利过渡。
打通数据、模型与智能体链路：企业数据是驱动模型与智能体运行的核心要素。红帽AI 3.4 新增提示词管理功能，将提示词作为一级数据资产管理，同时推出评估中心，可从质量、准确性、安全性及风险维度统筹管理各类评估工作。上述能力由MLflow提供支持，可为生成式AI与预测式AI/ML场景，提供集成式实验追踪以及产物管理功能。
集成式模型与智能体安全防护：为助力保护整个AI堆栈，红帽AI构建了分层安全防护体系，防护范围从操作系统延伸至智能体逻辑。通过自动化安全测试与红队测试，企业可采用数据驱动的方式完成模型及安全护栏的选型与配置，更好地抵御不断演进的威胁，保障AI工作负载安全。

更多详情

高级推理与模型优化：红帽AI推理在其分布式推理能力中新增请求优先级排序功能，可实现交互流量与后台流量共用同一端点，高负载场景下优先处理时延敏感型请求。红帽AI推理还超越了红帽OpenShift，扩展至其他Kubernetes服务，包括CoreWeave和Azure，为企业提供跨环境一致的推理堆栈。现已全面推出的投机解码（speculative decoding）支持，可在几乎不影响质量的前提下，将响应速度提升2至3倍，同时降低单次交互成本。
受治理的模型即服务（MaaS）：该功能支持平台工程师通过安全增强型API端点，基于兼容OpenAI的标准接口交付经过验证的精选模型，实现内部模型与外部API的统一治理，并集成基于身份提供商（IDP）的身份认证。
集成式提示词管理：该平台提供统一工具，将提示词作为一级数据资产进行构建和管理。将驱动模型和智能体的输入存储在中央注册表中，为开发者和管理员提供了单一数据源。
模型与智能体自动化评估：红帽AI 3.4推出评估中心，这是一套与框架无关的统一AI评估控制平面，可对大语言模型（LLM）、AI应用及智能体开展评估。该功能以统一的评估方式替代了碎片化测试方法，可以对质量、准确性与风险水平进行基准测试。
多层安全防护：自动化对抗性扫描现已直接集成至开发生命周期中。红帽AI平台依托Chatterbox Labs技术，采用Garak工具筛查模型与智能体系统存在的越狱攻击、提示词注入、偏见等风险，并搭配NVIDIA NeMo Guardrails实现运行时安全防护。
生产级可观测性：通过集成MLflow，实现对智能体执行过程的可视化监控，借助OpenTelemetry完成LLM调用、推理步骤、工具执行、模型响应及token使用情况的端到端追踪。为提示词、嵌入向量、RAG配置的全生命周期建立透明审计轨迹，便于调试与审计工作。同时，MLflow可为生成式AI与预测式AI场景提供集成式实验追踪以及产物管理功能。
基于身份的治理：通过加密身份管理（SPIFFE/SPIRE），红帽AI使企业能够用短期Token取代静态硬编码密钥。这支持整个堆栈中自主智能体的最小权限操作，并有助于确保智能体行为与经过验证的身份相关联。
自动化体验：AutoRAG和AutoML等工具可自动化处理复杂的AI任务，涵盖从为特定数据集选择最有效的检索策略，到构建和优化传统预测模型等各个方面。
硬件灵活性与托管云：红帽AI 3.4提供对NVIDIA Blackwell GPU和AMD MI325X架构的零日支持。通过将该统一平台架构扩展至在第三方托管云上原生运行——包括通过全新的Red Hat AI Inference on IBM Cloud——红帽提供了跨多种硬件和云服务提供商的运营一致性。

可用性

红帽AI 3.4 预计将于2026年5月晚些时候发布。

来源：至顶网软件与服务频道

红帽

0赞

好文章，需要你的鼓励

红帽AI 3.4发布：重大升级打通开发运维协作链路，赋能智能体未来

来源：至顶网软件与服务频道

2026

05/13

15:40

分享

点赞

软件质量治理：企业数字化的隐性入场券

明阳电气马来西亚首个海外生产基地投产，输配电设备开始本地制造

我用谷歌云盘新AI整理工具清理14年的文件杂乱，结果如何？

利用智能手机前置摄像头被动监测心率的研究系统

AI时代如何避免网络管理工具的重叠与混乱

英特尔凭借机器人芯片重磅杀入物理AI赛道

PATH计划：推动AI培训与职业发展，助力行业人才培育

AMD第二代Versal Prime加速器正式出货

微软为Windows引入Coreutils，让Linux开发者告别平台切换烦恼

Canva推出Perplexity Computer连接器，助力智能体自动生成设计资产

三星Health应用迎来重大AI改版，为Galaxy Watch 9铺路

Sonos Play 评测：便携智能音箱新标杆

新版红帽企业Linux来了，赋能后量子就绪能力与AI驱动的自动化

从SDV到AIDV，汽车行业为什么需要全球化底座

操作系统重构：AI与容器化时代，IT运维团队如何实现体系化升级？

红帽推出红帽AI Enterprise，打造从底层硬件到智能体的一体化AI平台

红帽和NVIDIA AI工厂发布，助力加速可扩展生产级AI落地

红帽深化与NVIDIA的合作，将企业级开源与机架级AI深度结合，加速实现可投入生产的创新

开源红帽，加速AI

科世达、德华安顾人寿、宝洁和汇丰银行荣获2025红帽亚太创新奖

红帽推出红帽AI 3，将分布式AI推理引入生产级AI工作负载

在代理式AI中构建信任

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: