“几十年来,我们塑造了这个世界,而现在规则正在改变。虽然这可能令人恐惧和不安,但退一步来看,其潜力不可否认。”红帽总裁兼首席执行官 Matt Hicks在Red Hat Summit 2025上说,红帽的使命是为客户提供真正的选择和灵活性。
一年前,几乎每次与客户开会,他们都会以“AI 安全吗?”来开场,而且这个问题没有具体指向哪类安全。现在与客户讨论,则是从明确的业务用例开始,随后才是合规与防护。
红帽相信开放将继续带来更快速、更优质的安全改进,而非相反。去年Red Hat Summit带来了Linux AI(RHEL AI)和OpenShift AI的重磅更新,今年则重点聚焦在Linux 10和llm-d。
红帽总裁兼首席执行官 Matt Hicks
Linux 10这块基石再次升级
红帽企业Linux 10(RHEL 10)可以说是红帽AI的基石,在其上红帽打造和优化的AI解决方案,包括红帽AI推理服务器、红帽OpenShift AI和红帽企业Linux AI(RHEL AI)。
红帽企业Linux 10的主要新增功能包括:
现在为混合云做好准备,使用AWS、Google Cloud和Microsoft Azure上,经过预调优、完全支持且可直接运行的红帽企业Linux镜像。
扩展IT工具包,通过红帽企业Linux扩展存储库,以更安全、更便捷的方式获取社区支持的软件,如Podman Desktop。
更好地创新,得益于经过合作伙伴验证的解决方案,这些解决方案建立在面向AI和其他要求苛刻的工作负载的先进硬件上,通过生产过程中的更多选择,突破可能性的边界。
探索新架构,通过与SiFive合作,在带有红帽企业Linux 10开发者预览版的RISC-V平台的开发方面抢占先机,为HiFive P550 RISC-V架构提供更加安全可靠的平台的早期访问。
微调安全策略,通过即将推出的红帽企业Linux安全选择插件,为Linux安全提供更多选择和便利,该插件每年可申请修复多达10个特定通用漏洞披露(CVE)。
红帽赞助的IDC研究表明,企业在招聘具备Linux技能的人才方面面临严峻挑战,难以有效运营和支持日益扩大的Linux发行版集群。这不仅加剧了安全漏洞、合规风险和应用停机的隐患,也暴露出企业在技术演进下对高效运维的迫切需求。
为弥补Linux管理中的关键技能短板,红帽企业Linux 10引入了红帽企业Linux Lightspeed。将生成式AI深度集成到平台中,借助自然语言界面,提供情境感知的操作指导和智能建议,从而提升新老IT专业人员对大规模红帽企业Linux环境的管理效率与精准度。
与此同时,红帽推出RHEL Partner Validation计划。红帽首席技术官兼全球工程高级副总裁Chris Wright强调,计划允许ISV自助完成兼容性测试并贴上“Validated on RHEL”标签,大大缩短上市周期。
llm-d社区打造生成式AI推理新标准
Gartner数据显示,到2028年,随着市场的成熟,80%以上的数据中心工作负载加速器将专门部署用于推理,而不是训练用途。
生成式AI的未来在于执行能力。Red Hat Summit 2025宣布启动全新开源项目llm-d,以满足生成式AI(gen AI)未来最关键的需求:大规模推理。llm-d采用原生Kubernetes架构、基于vLLM的分布式推理和智能AI感知网络路由,利用突破性的大规模生成式AI推理技术,让强大的大语言模型(LLM)推理云能够满足最苛刻的生产服务级目标(SLO)。
红帽的愿景非常明确,无论AI模型、底层加速器还是部署环境,红帽都致力于让vLLM成为新型混合云中推理的权威开放标准。
项目汇聚了领先的生成式AI模型提供商、AI加速器先驱和主要AI云平台。CoreWeave、Google Cloud、IBM Research和NVIDIA是该项目的创始贡献者,AMD、思科、Hugging Face、英特尔、Lambda和Mistral AI是该项目的合作伙伴,在构建大规模LLM服务未来上展开深度协作。此外,加州大学Sky Computing Lab(vLLM发起者)和芝加哥大学LMCache Lab(LMCache发起者)作为创始支持者,积极参与llm-d社区,共同推动技术创新与生态繁荣。
全新的Red Hat AI Inference Server(内置 vLLM)首发即支持Google Cloud TPU,以及Intel、AMD的硬件。
无论GitHub Star、下载量还是贡献者增速,vLLM已成为事实上的社区标准。而且这种“群策群力”的势能,让红帽对vLLM的未来格外兴奋。
AI时代让合作更加紧密
从印度到新西兰,金融、电信、政府等行业的创新活力十分旺盛。红帽高级副总裁兼首席营收官Andrew Brown谈到,客户选择红帽的原因很简单:平台自由——从小规模起步,快速扩展,并且随时在本地满足需求。
最近发布的OpenShift Virtualization、RHEL镜像模式(image mode)以及其开箱即用的特性,让部署更容易。客户可以选择适合自己的平台,即使身处远离大型科技中心的地区,也能获得一致、安全、可靠的平台体验。
生态合作一直写在红帽的基因里,把成果延伸给ISV、系统集成商、云服务商是红帽持续在做的一件事。
AI时代的到来,让生态合作变得更加紧密。首先,Marketplace组合销售:AWS的Distributor Seller of Record(DSOR)计划允许分销商把不同伙伴的产品打包上架。红帽已在澳大利亚把红帽解决方案与本地ISV的产品服务捆绑销售,并期待未来在RHEL AI和OpenShift AI 上也复制这一做法;其次,上游共同创新:Google Cloud正与红帽在上游社区中携手合作;最后,用户选择优先:红帽正在努力和云厂商以及其他合作伙伴集成,确保客户能够轻松获取其产品。
好文章,需要你的鼓励
VMware宣布将终止现有渠道合作伙伴计划,新计划采用邀请制,大幅减少授权合作伙伴数量。未受邀合作伙伴将于2025年7月15日收到不续约通知,可继续交易至10月31日。白标计划也将同时终止。此举是18个月内VMware第二次重大合作伙伴调整,旨在专注与少数核心云服务提供商深度合作。客户可能面临续约困难、服务质量下降和成本上升等影响。
StepFun公司推出的Step1X-Edit是首个能够媲美GPT-4o和Gemini2 Flash等商业模型的开源图像编辑AI。该模型通过整合多模态语言理解和扩散图像生成技术,能够处理11种编辑任务,在新构建的GEdit-Bench基准测试中表现优异,为图像编辑技术的民主化开辟了新道路。
谷歌DeepMind和伦敦大学学院研究发现,大语言模型在面对反驳时会迅速失去信心并改变答案,即使反驳是错误的。研究显示LLM既会对自己的答案过度自信,又对批评异常敏感,表现出与人类相似但又独特的认知偏差。这种行为对多轮对话AI系统构成威胁,最新信息可能对LLM推理产生不成比例的影响。
BluOrion公司开发的ZClip是一种智能梯度裁剪算法,解决了大型语言模型训练中的梯度爆炸和损失飙升问题。通过Z分数统计检测和动态调整策略,ZClip能够自适应地控制梯度幅度,相比传统固定阈值方法提升训练效率35%以上,同时显著降低训练失败风险,为大模型训练提供了更稳定、高效的解决方案。