近日,红帽宣布已完成对Neural Magic的收购。Neural Magic是一家在加速生成式AI(gen AI)推理工作负载的软件与算法领域的先锋企业。
通过此次收购,红帽引入了推理性能优化和模型优化领域的专业能力,进一步推进其愿景,即在混合云的任意位置,根据客户独特需求提供高性能的AI工作负载支持。
支撑当前生成式AI应用的大型语言模型(LLM)虽然具有创新性,但往往成本高昂且资源消耗巨大,大多数组织难以有效利用。
为应对这些挑战,红帽认为,未来AI战略的成功关键在于开发更小、更优化并采用开源许可的模型,通过在计算架构和部署环境中的开放创新来实现。
Neural Magic致力于将优化且高效的AI模型变为现实,这进一步增强了红帽实现AI愿景的能力。
Neural Magic也是vLLM的主要贡献者之一,vLLM是由加州大学伯克利分校开发的一个开源项目,专注于开放模型服务,这将为组织在构建和部署AI工作负载方面提供更多选择和更高的可及性。
借助Neural Magic的技术与性能工程专业知识,红帽致力于破解大规模企业AI面临的挑战,通过开源创新进一步推动AI变革的普及。具体路径包括:
开源许可模型:提供从10亿到数千亿参数规模的模型,可灵活运行于混合云的任意环境中——包括企业数据中心、多云部署以及边缘场景。
模型微调能力:帮助企业更高效地根据私有数据和特定用例定制大型语言模型(LLM),同时增强安全性。
推理性能优化专业知识:显著提升运营效率和基础设施利用率。
合作伙伴与开源生态系统支持:从LLM和相关工具,到认证服务器硬件及底层芯片架构,为客户提供更丰富的选择,满足多样化需求。
“选择”这一理念对于今天的生成式AI至关重要,就如同几年前的云原生和容器化应用一样。成功的生成式AI战略依赖于合适的环境(如云、服务器、边缘等)、加速计算能力以及推理服务器。
红帽始终致力于在混合云环境中为客户提供广泛的选择,尤其是在AI领域。收购Neural Magic进一步巩固了我们对这一承诺的支持。
Neural Magic的技术和专业能力将融入红帽AI,打造一个专为生成式AI平台设计的产品组合,秉承混合云架构,红帽AI包括:
红帽企业Linux AI (RHEL AI):基础模型平台,在Linux服务器上无缝开发、测试和运行IBM Granite开源许可LLM家族,支持企业应用。
红帽OpenShift AI:AI平台,提供工具快速开发、训练、部署和监控机器学习模型,涵盖本地、公共云及边缘分布式Kubernetes环境。
InstructLab:由红帽与IBM联合创建的开源AI社区项目,通过协作改进开源许可的Granite LLM,利用InstructLab的微调技术,让任何人都能参与塑造生成式AI的未来。
vLLM、LLM Compressor、预优化模型等将被整合到红帽AI,让Neural Magic成为红帽AI平台的关键组成部分。
Matt Hicks,红帽总裁兼CEO
效率、优化和选择是传统企业IT中的核心概念,我们认为生成式AI也应如此。通过将Neural Magic在生成式AI性能工程和优化方面的专长引入红帽AI,从工作负载的运行环境到模型的调优与训练,我们进一步履行了为客户提供满足其独特需求的生成式AI承诺。
Brian Stevens,Neural Magic首席执行官
Neural Magic在开源AI领域的研究和技术贡献,显著降低了部署大规模先进大型语言模型所需的基础设施。红帽与我们共同认为‘AI的未来在于开源’,我们期待与红帽合作,帮助企业更轻松地实现生成式AI的价值。
Dave McCarthy,IDC云与边缘服务全球基础设施研究副总裁
红帽收购Neural Magic是对其AI能力的战略增强,凭借Neural Magic在模型优化和推理加速方面的专长,促进了AI在混合云中的部署。这不仅契合红帽对开源创新的承诺,也使公司能够提供更具成本效益和可扩展性的AI解决方案,减少对专用硬件的依赖。
好文章,需要你的鼓励
存储扩展专家Lucidity将其AutoScaler平台扩展至Kubernetes容器编排平台,帮助企业控制存储支出。该公司表示,Kubernetes中的持久卷常常成为隐形浪费源,虽然Kubernetes可自动扩展实例数量,但底层存储通常未被充分利用。新服务可为亚马逊EKS提供持久卷的自动扩缩容,声称可为客户节省高达70%的云块存储费用。
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
超过1.8万Spotify用户加入名为"Unwrapped"的集体组织,通过去中心化数据平台Vana将个人听歌数据打包出售给AI开发者。该组织已将1万用户的艺术家偏好数据以5.5万美元价格售出,用于构建新型流媒体数据分析工具。Spotify对此发出警告,称该行为违反开发者政策和商标权,禁止将平台数据用于机器学习模型构建。但Unwrapped团队坚持用户拥有控制和变现个人数据的权利,双方就数据所有权展开争议。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。