全球领先的企业级开源解决方案提供商红帽近日宣布,对红帽AI产品组合进行重大升级,旨在帮助企业弥合AI实验与生产级运维控制之间的鸿沟。通过推出从底层硬件到智能体(metal-to-agent)的统一平台,红帽AI 3.4简化了智能体工作流(agentic workflows)的开发与部署,帮助企业从试点项目迈向可覆盖其整个基础设施的可扩展AI应用。
通过为开发者与运维人员提供统一框架,红帽为企业扩展自主系统提供了基础平台,并同时确保了现代企业所需的控制力、安全能力与硬件效率。
什么是红帽AI 3.4?
红帽AI 3.4是一个综合性平台,提供在混合云环境中扩展模型与智能体工作流必需的架构基础与运维工具。此次发布的核心能力是模型即服务(MaaS),可为开发者提供受治理的统一接口,支持其访问各个精选模型,同时也支持管理员跟踪模型使用情况并实施策略控制。该能力构建于高性能分布式推理基础平台之上,由vLLM与llm-d驱动,从而支持模型服务在广泛环境中的优化、高效运行。
随着AI智能体推动推理需求呈指数级增长,红帽AI为企业提供了与智能体框架无关的大规模部署与管理能力。新推出的AgentOps工具可覆盖从开发到生产的智能体全程管理,包括集成式追踪、可观测性、加密身份与生命周期管理等能力。
为实现企业数据与模型、智能体的深度融合,红帽AI 3.4还新增提示词(prompt)管理能力,将提示词作为一级数据资产(first-class data assets)管理,同时推出评估中心,用于评估模型与智能体的准确率、质量与安全性。上述能力由MLflow提供支持,可为生成式AI与预测式AI场景,提供集成式实验追踪以及产物(artifact)管理功能。此外,该平台还使用Chatterbox Labs和Garak项目的技术,通过面向模型与智能体的自动化安全测试与红队测试能力,助力用户验证其安全性,为从实验性试点到生产就绪的企业级应用,提供一条以安全为先的实施路径。
为什么重要?
从实验性聊天机器人向生产级自主系统转型,需要IT团队之间的协作方式进行根本性转变。如今,许多企业已经意识到,为了更好地控制成本和支持私有AI与主权AI场景,需要从单纯的Token消费者转变为Token提供者。然而,开发团队与基础设施管理团队之间的协作摩擦,依然是相关技术模式落地的主要障碍之一。如果缺乏一种能够协调这两个角色的统一方法,基础设施访问受限会拖慢创新速度,而影子AI的捷径则会带来不受管控的风险与不可预测的成本。
红帽AI 3.4面向可扩展推理与自主智能体部署,推出企业基础平台,帮助缓解这一矛盾,提供了满足严格风险与治理标准所需的透明度与控制力。由于智能体具备一定独立性,对其决策过程缺乏可见性可能带来重大安全风险。对此,红帽AI提供的基础设施可以追踪操作、推理步骤、工具调用,使企业能够审计智能体的决策路径。同时,平台通过加密身份管理,将操作行为与已验证身份相关联,帮助企业识别执行相关任务的实体。这些能力将共同助力企业超越孤立的试点阶段,将AI作为一种可扩展、可预测且最重要的是可追责的企业级工具。
红帽及其合作伙伴的观点
红帽AI业务部副总裁兼总经理Joe Fernandes表示:“智能体时代意味着,我们的平台正在演进,从运行传统应用转向驱动智能自主系统。我们正在定义企业运行AI的开放标准。通过为AI推理、模型即服务、AgentOps提供从底层硬件到智能体的强化型基础平台,红帽为企业提供了所需的运维保障,使其能够在保持严格控制的同时实现大规模创新。”
CoreWeave AI服务产品管理副总裁Urvashi Chowdhary表示:“CoreWeave与红帽的合作,根植于双方对开放理念的共同坚守,旨在打造高性能推理基础平台,助力企业扩展其最复杂的AI工作负载。双方共同推出了基于CoreWeave Kubernetes Service的红帽AI推理部署蓝图,支持在本地和云端运行相同的推理堆栈,并具备Kubernetes原生的控制与生产级性能。这让受监管行业的企业AI团队能够专注于构建和扩展AI的重要工作,而无需为每个新环境重新调整其堆栈。”
NVIDIA企业软件副总裁John Fanelli表示:“企业中自主化、长期运行的智能体,需要更高水平的基础设施控制与安全保障能力,以确保大规模场景下的可信运行。红帽和NVIDIA AI工厂提供了开源驱动的统一基础平台,为开发者与运维人员提供了迈向智能体未来必需的治理能力与可靠性。”
主要亮点
更多详情
可用性
红帽AI 3.4 预计将于2026年5月晚些时候发布。
好文章,需要你的鼓励
FORTIS是专门测量AI代理"越权行为"的基准测试,研究发现十款顶尖模型普遍选择远超任务需要的高权限技能,端到端成功率最高仅14.3%。
谷歌在Android Show发布会上宣布,将Gemini更深度整合至Android系统,推出名为"Gemini Intelligence"的升级功能。该功能可跨应用处理日常任务,包括自动填写表单、安排日程、生成购物清单及自定义小组件等,无需用户频繁切换应用。此外,Gboard新增"Rambler"功能,可自动过滤语音输入中的口误和填充词。Gemini Intelligence将率先登陆三星Galaxy和谷歌Pixel手机,并支持Android Auto、Wear OS及智能眼镜。
荷兰Nebius团队提出SlimSpec,通过低秩分解压缩草稿模型LM-Head的内部表示而非裁剪词汇,在保留完整词汇表的同时将LM-Head计算时间压缩至原来的五分之一,端到端推理速度超越现有方法最高达9%。