全球领先的开源解决方案提供商红帽公司日前宣布,即将在红帽OpenShift AI上集成支持NVIDIA NIM微服务。这一举措旨在在一致的开源AI/ML混合云平台支持下,为数十种人工智能(AI)模型实现优化推理。企业将能够利用红帽OpenShift AI和NVIDIA NIM(NVIDIA 企业AI 软件平台的一部分,是一套易于使用的推理微服务),加速生成式AI(GenAI)应用的交付,从而更快地实现价值。
红帽 OpenShift AI 对 NVIDIA NIM 的支持,基于红帽行业领先的开放混合云技术,包括 红帽企业Linux和 红帽OpenShift,建立在对 NVIDIA 企业 AI 的现有优化基础之上。作为最新合作的一部分,NVIDIA 将实现 NIM 与 KServe 的互操作性,KServe 是一个基于 Kubernetes 的开源项目,适用于高度可扩展的 AI 用例,同时也是 红帽OpenShift AI 的核心上游贡献者。这将有助于促进 NVIDIA NIM 微服务在红帽 OpenShift AI 未来迭代中的持续互操作性。
这种集成使企业能够利用 GenAI 功能提高生产率,例如利用虚拟助理扩展客户服务、对 IT 单据进行案例汇总,以及利用特定领域的协同机器人加速业务运营。
通过将红帽OpenShift AI 与 NVIDIA NIM 结合使用,企业可以从以下方面获益:
NVIDIA NIM 微服务旨在加速企业的 GenAI 部署。NIM 支持多种 AI 模型,包括开源社区模型、NVIDIA AI 基础模型和自定义模型,通过行业标准的应用编程接口(API),能够在企业内部或云端提供无缝、可扩展的 AI 推断服务。
支持证言
Chris Wright, 红帽CTO兼全球工程高级副总裁
“在与 NVIDIA 的合作中,红帽专注于消除障碍,降低复杂性,从而让企业能快速构建、管理和部署AI应用。红帽 OpenShift AI 为扩展 NIM 微服务的覆盖范围提供了一个可扩展、灵活的基础,通过预构建的容器和行业标准 API 为开发人员赋能,所有这些都由开源创新驱动。”
Justin Boitano,NVIDIA企业产品副总裁
“每个企业开发团队都希望尽可能快速、安全地将他们的生成式人工智能应用投入生产。在红帽 OpenShift AI 中集成 NVIDIA NIM 标志着我们合作的一个新里程碑,因为这将帮助开发人员利用性能优化的基础和嵌入模型,在任何云或数据中心中快速构建和扩展现代企业应用。”
好文章,需要你的鼓励
Anthropic发布了面向成本敏感用户的Claude Haiku 4.5大语言模型,定价为每百万输入令牌1美元,输出令牌5美元,比旗舰版Sonnet 4.5便宜三倍。该模型采用混合推理架构,可根据需求调整计算资源,支持多模态输入最多20万令牌。在八项基准测试中,性能仅比Sonnet 4.5低不到10%,但在编程和数学任务上超越了前代Sonnet 4。模型响应速度比Sonnet 4快两倍以上,适用于客服聊天机器人等低延迟应用场景。
字节跳动发布Seedream 4.0多模态图像生成系统,实现超10倍速度提升,1.4秒可生成2K高清图片。该系统采用创新的扩散变换器架构,统一支持文字生成图像、图像编辑和多图合成功能,在两大国际竞技场排行榜均获第一名,支持4K分辨率输出,已集成至豆包、剪映等平台,为内容创作带来革命性突破。
英国初创公司Nscale将为微软建设四个AI数据中心,总计部署约20万个GPU,合同价值高达240亿美元。首个数据中心将于明年在葡萄牙开建,配备1.26万个GPU。德州数据中心规模最大,将部署10.4万个GPU,容量从240兆瓦扩展至1.2吉瓦。所有设施将采用英伟达最新Blackwell Ultra显卡。
红帽公司研究团队提出危险感知系统卡(HASC)框架,为AI系统建立类似"体检报告"的透明度文档,记录安全风险、防护措施和问题修复历史。同时引入ASH识别码系统,为AI安全问题建立统一标识。该框架支持自动生成和持续更新,与ISO/IEC 42001标准兼容,旨在平衡透明度与商业竞争,建立更可信的AI生态系统,推动行业协作和标准化。