“几十年来,我们塑造了这个世界,而现在规则正在改变。虽然这可能令人恐惧和不安,但退一步来看,其潜力不可否认。”红帽总裁兼首席执行官 Matt Hicks在Red Hat Summit 2025上说,红帽的使命是为客户提供真正的选择和灵活性。
一年前,几乎每次与客户开会,他们都会以“AI 安全吗?”来开场,而且这个问题没有具体指向哪类安全。现在与客户讨论,则是从明确的业务用例开始,随后才是合规与防护。
红帽相信开放将继续带来更快速、更优质的安全改进,而非相反。去年Red Hat Summit带来了Linux AI(RHEL AI)和OpenShift AI的重磅更新,今年则重点聚焦在Linux 10和llm-d。
红帽总裁兼首席执行官 Matt Hicks
Linux 10这块基石再次升级
红帽企业Linux 10(RHEL 10)可以说是红帽AI的基石,在其上红帽打造和优化的AI解决方案,包括红帽AI推理服务器、红帽OpenShift AI和红帽企业Linux AI(RHEL AI)。
红帽企业Linux 10的主要新增功能包括:
现在为混合云做好准备,使用AWS、Google Cloud和Microsoft Azure上,经过预调优、完全支持且可直接运行的红帽企业Linux镜像。
扩展IT工具包,通过红帽企业Linux扩展存储库,以更安全、更便捷的方式获取社区支持的软件,如Podman Desktop。
更好地创新,得益于经过合作伙伴验证的解决方案,这些解决方案建立在面向AI和其他要求苛刻的工作负载的先进硬件上,通过生产过程中的更多选择,突破可能性的边界。
探索新架构,通过与SiFive合作,在带有红帽企业Linux 10开发者预览版的RISC-V平台的开发方面抢占先机,为HiFive P550 RISC-V架构提供更加安全可靠的平台的早期访问。
微调安全策略,通过即将推出的红帽企业Linux安全选择插件,为Linux安全提供更多选择和便利,该插件每年可申请修复多达10个特定通用漏洞披露(CVE)。
红帽赞助的IDC研究表明,企业在招聘具备Linux技能的人才方面面临严峻挑战,难以有效运营和支持日益扩大的Linux发行版集群。这不仅加剧了安全漏洞、合规风险和应用停机的隐患,也暴露出企业在技术演进下对高效运维的迫切需求。
为弥补Linux管理中的关键技能短板,红帽企业Linux 10引入了红帽企业Linux Lightspeed。将生成式AI深度集成到平台中,借助自然语言界面,提供情境感知的操作指导和智能建议,从而提升新老IT专业人员对大规模红帽企业Linux环境的管理效率与精准度。
与此同时,红帽推出RHEL Partner Validation计划。红帽首席技术官兼全球工程高级副总裁Chris Wright强调,计划允许ISV自助完成兼容性测试并贴上“Validated on RHEL”标签,大大缩短上市周期。
llm-d社区打造生成式AI推理新标准
Gartner数据显示,到2028年,随着市场的成熟,80%以上的数据中心工作负载加速器将专门部署用于推理,而不是训练用途。
生成式AI的未来在于执行能力。Red Hat Summit 2025宣布启动全新开源项目llm-d,以满足生成式AI(gen AI)未来最关键的需求:大规模推理。llm-d采用原生Kubernetes架构、基于vLLM的分布式推理和智能AI感知网络路由,利用突破性的大规模生成式AI推理技术,让强大的大语言模型(LLM)推理云能够满足最苛刻的生产服务级目标(SLO)。
红帽的愿景非常明确,无论AI模型、底层加速器还是部署环境,红帽都致力于让vLLM成为新型混合云中推理的权威开放标准。
项目汇聚了领先的生成式AI模型提供商、AI加速器先驱和主要AI云平台。CoreWeave、Google Cloud、IBM Research和NVIDIA是该项目的创始贡献者,AMD、思科、Hugging Face、英特尔、Lambda和Mistral AI是该项目的合作伙伴,在构建大规模LLM服务未来上展开深度协作。此外,加州大学Sky Computing Lab(vLLM发起者)和芝加哥大学LMCache Lab(LMCache发起者)作为创始支持者,积极参与llm-d社区,共同推动技术创新与生态繁荣。
全新的Red Hat AI Inference Server(内置 vLLM)首发即支持Google Cloud TPU,以及Intel、AMD的硬件。
无论GitHub Star、下载量还是贡献者增速,vLLM已成为事实上的社区标准。而且这种“群策群力”的势能,让红帽对vLLM的未来格外兴奋。
AI时代让合作更加紧密
从印度到新西兰,金融、电信、政府等行业的创新活力十分旺盛。红帽高级副总裁兼首席营收官Andrew Brown谈到,客户选择红帽的原因很简单:平台自由——从小规模起步,快速扩展,并且随时在本地满足需求。
最近发布的OpenShift Virtualization、RHEL镜像模式(image mode)以及其开箱即用的特性,让部署更容易。客户可以选择适合自己的平台,即使身处远离大型科技中心的地区,也能获得一致、安全、可靠的平台体验。
生态合作一直写在红帽的基因里,把成果延伸给ISV、系统集成商、云服务商是红帽持续在做的一件事。
AI时代的到来,让生态合作变得更加紧密。首先,Marketplace组合销售:AWS的Distributor Seller of Record(DSOR)计划允许分销商把不同伙伴的产品打包上架。红帽已在澳大利亚把红帽解决方案与本地ISV的产品服务捆绑销售,并期待未来在RHEL AI和OpenShift AI 上也复制这一做法;其次,上游共同创新:Google Cloud正与红帽在上游社区中携手合作;最后,用户选择优先:红帽正在努力和云厂商以及其他合作伙伴集成,确保客户能够轻松获取其产品。
好文章,需要你的鼓励
zip2zip是一项创新技术,通过引入动态自适应词汇表,让大语言模型在推理时能够自动组合常用词组,显著提高处理效率。由EPFL等机构研究团队开发的这一方法,基于LZW压缩算法,允许模型即时创建和使用"超级tokens",将输入和输出序列长度减少20-60%,大幅提升推理速度。实验表明,现有模型只需10个GPU小时的微调即可适配此框架,在保持基本性能的同时显著降低计算成本和响应时间,特别适用于专业领域和多语言场景。
这项研究创新性地利用大语言模型(LLM)代替人类标注者,创建了PARADEHATE数据集,用于仇恨言论的无毒化转换。研究团队首先验证LLM在无毒化任务中表现可与人类媲美,随后构建了包含8000多对仇恨/非仇恨文本的平行数据集。评估显示,在PARADEHATE上微调的模型如BART在风格准确性、内容保留和流畅性方面表现优异,证明LLM生成的数据可作为人工标注的高效替代方案,为创建更安全、更具包容性的在线环境提供了新途径。
这项研究由中国科学技术大学的研究团队提出了Pro3D-Editor,一种新型3D编辑框架,通过"渐进式视角"范式解决了现有3D编辑方法中的视角不一致问题。传统方法要么随机选择视角迭代编辑,要么同时编辑多个固定视角,都忽视了不同编辑任务对应不同的"编辑显著性视角"。Pro3D-Editor包含三个核心模块:主视角采样器自动选择最适合编辑的视角,关键视角渲染器通过创新的MoVE-LoRA技术将编辑信息传递到其他视角,全视角精修器修复并优化最终3D模型。实验证明该方法在编辑质量和准确性方面显著优于现有技术。
这项研究提出了ComposeAnything,一个无需重新训练的框架,可显著提升AI图像生成模型处理复杂空间关系的能力。该技术由INRIA、巴黎高师和CNRS的研究团队开发,通过三个创新步骤工作:首先利用大型语言模型创建包含深度信息的2.5D语义布局,然后生成粗略的场景合成图作为先验指导,最后通过物体先验强化和空间控制去噪引导扩散过程。在T2I-CompBench和NSR-1K基准测试中,该方法远超现有技术,特别是在处理复杂空间关系和多物体场景时表现卓越,为AI辅助创意设计开辟新可能。