全球领先的企业级开源解决方案提供商红帽近日宣布,推出红帽和NVIDIA AI工厂(Red Hat AI Factory with NVIDIA)。这款由双方联合研发的软件平台整合了红帽AI Enterprise与NVIDIA AI Enterprise,为需要大规模部署人工智能(AI)的企业提供优化的端到端AI解决方案。红帽和NVIDIA AI工厂是双方深度合作的最新里程碑,在助力将最新AI创新成果加速交付给企业客户的同时,还将对NVIDIA硬件架构实现Day 0支持。
预计到2029年,企业AI支出将突破1万亿美元[1],智能体AI应用将成为主要增长动力。企业机构正寻求将战略转向高密度的智能体工作流,并需要应对由此带来的AI推理与基础设施压力。对此,红帽和NVIDIA AI工厂可以赋能IT运维团队,同时简化传统基础设施和AI技术堆栈不断发展的需求的管理,帮助企业机构跟上AI发展的节奏。
红帽和NVIDIA AI工厂能够加快生产级AI的发展进程,为AI工厂提供软件平台。该平台基于加速计算基础设施运行,可助力提升模型性能,并通过NVIDIA GPU驱动推理堆栈。目前,思科、戴尔科技、联想及Supermicro等领先系统制造商的AI工厂基础设施均已支持该平台。这让IT管理员和运营团队能够以企业级工作负载的运营严谨性和可预测性,实现AI部署的弹性扩展与持续维护。
这一联合研发的软件平台,融合了红帽与NVIDIA在开源协作、技术研发与服务支持方面的专业能力,打造了一款值得信赖的企业级解决方案。红帽和NVIDIA AI工厂为跨任意环境的AI部署提供了高度可扩展的底座,覆盖本地、云端与边缘场景,具备高性能AI推理、模型调优、定制化以及智能体部署和管理等核心能力,并重点强调安全防护,帮助企业机构实现从数据中心到公有云的架构管控,提供:
可用情况
红帽和NVIDIA AI工厂现已可用。
支持证言
红帽首席技术官兼全球工程高级副总裁Chris Wright
“从AI实验转向工业级、全企业范围的生产,需要对AI计算堆栈的管理方式进行根本性变革。借助红帽和NVIDIA AI工厂,我们正加速AI部署进程,实现快速投产。凭借成熟的混合云产品组合构建的稳定、高性能底座,我们助力客户掌控自身AI战略,并以与核心IT平台同等的严谨性实现规模化扩展。”
NVIDIA企业AI平台副总裁Justin Boitano
“企业正在构建能够在推理环节中大规模地将数据转化为智能的AI工厂,这需要覆盖混合云的生产级基础设施与软件。红帽和NVIDIA AI工厂提供了软件底座,助力企业机构跟上基础设施快速创新的步伐,可靠地构建和部署新一代智能体AI应用。”
思科计算高级副总裁兼总经理Jeremy Foster
“思科致力于帮助客户在各类分布式环境中,安全、规模化地把AI从实验推向生产落地。通过支持红帽和NVIDIA AI工厂,思科为企业机构提供了从数据中心到边缘一致的企业级基础设施,助力AI部署和运营。我们携手为客户提供了更简单、更可靠的方式,将AI作为关键任务型工作负载运行,同时满足企业对其核心基础设施在性能、安全性和运营控制上的期望。”
戴尔科技基础设施解决方案集团高级副总裁兼首席技术官Ihab Tarazi
“企业正快速推进AI投资的落地运营,但这需要一套能在混合环境中可靠运行的强大集成基础设施。通过与红帽和NVIDIA合作,我们将为客户带来全新水平的集成能力,进一步加速企业AI成果的实现。”
联想基础设施解决方案业务集团高级副总裁Vlad Rozanovich
“企业AI的下一个时代关乎实时行动与切实商业回报,这需要具备工业级强度的混合底座。我们能提供一个可扩展的企业级平台,融合联想推理优化的基础设施与红帽和NVIDIA AI工厂,为客户创造实时优势——构建可在任意运营环境部署和管理的弹性智能体AI底座。”
Supermicro技术与AI高级副总裁,欧洲、中东及非洲地区总裁兼董事总经理Vik Malyala
“Supermicro拥有丰富的红帽认证系统产品组合,致力于为AI工厂提供最先进的加速计算基础设施。我们面向红帽和NVIDIA AI工厂的验证解决方案,助力确保客户能够集成高性能专用系统与强大的企业级软件平台。这将简化关键任务型企业AI工作负载的部署与扩展,助力企业机构在混合云环境中更快实现价值,并确保可预测的高效运营。”
TD SYNNEX云、安全与AI高级副总裁Francisco Criado
“作为领先的端到端分销商,同时也是红帽与NVIDIA长期的合作伙伴,TD SYNNEX很高兴能将红帽和NVIDIA AI工厂带给我们的渠道合作伙伴及其客户,作为TD SYNNEX Destination AI计划的重要补充。这一优化后的企业级解决方案消除了AI构建和部署的复杂性,帮助企业机构在混合云环境中充分发挥其AI投资的潜力,助力企业机构加速实现真正的商业价值。”
WWT,全球解决方案与架构,云与基础设施解决方案副总裁Neil Anderson
“WWT致力于协助企业机构突破AI实验阶段,在IT环境中成功实现生产部署规模化扩展。红帽和NVIDIA AI工厂通过提供经过验证的平台,有效满足这一需求——它能简化部署流程、加速价值实现,并为客户提供运营一致性保障。”
[1] IDC,未来五年智能体AI将成为IT预算增长主力,占全球IT支出的比例将超过26%,2029年规模将达1.3万亿美元,2025年8月26日
好文章,需要你的鼓励
FORTIS是专门测量AI代理"越权行为"的基准测试,研究发现十款顶尖模型普遍选择远超任务需要的高权限技能,端到端成功率最高仅14.3%。
谷歌在Android Show发布会上宣布,将Gemini更深度整合至Android系统,推出名为"Gemini Intelligence"的升级功能。该功能可跨应用处理日常任务,包括自动填写表单、安排日程、生成购物清单及自定义小组件等,无需用户频繁切换应用。此外,Gboard新增"Rambler"功能,可自动过滤语音输入中的口误和填充词。Gemini Intelligence将率先登陆三星Galaxy和谷歌Pixel手机,并支持Android Auto、Wear OS及智能眼镜。
荷兰Nebius团队提出SlimSpec,通过低秩分解压缩草稿模型LM-Head的内部表示而非裁剪词汇,在保留完整词汇表的同时将LM-Head计算时间压缩至原来的五分之一,端到端推理速度超越现有方法最高达9%。