不久前,英特尔宣布以Premier会员的身份加入PyTorch*基金会,并期待与各行各业的领军企业在开源PyTorch框架和生态系统上开展合作。PyTorch能够加速人工智能应用的开发,这将促进试验与创新,在加速AI发展方面发挥关键作用。加入PyTorch基金会,进一步彰显了英特尔致力于通过技术支持并培育其生态系统以加速机器学习框架的演进。
英特尔自2018年起为PyTorch提供支持,旨在通过丰富的硬件和开放的软件推动AI普及。英特尔正在不断推进PyTorch并拓展生态,以创新为先,推动构建一个“AI触手可及”的未来。
英特尔通过优化,提升PyTorch* 2.0功能
PyTorch受益于英特尔为x86提供的诸多优化,包括利用英特尔® oneAPI深度神经网络库(oneDNN)加速PyTorch,针对aten算子和BFloat16的优化,以及自动混合精度支持。英特尔也积极参与PyTorch通用功能(如量化和编译器)的设计与部署,为PyTorch 2.0提供了四个重要性能特性:
1. 优化TorchInductor CPU FP32推理
2. 在PyG中改进图神经网络(GNN),以支持推理和训练性能
3. 针对x86 CPU平台,优化了统一量化后端的int8推理
4. 利用oneDNN Graph API加速在CPU上的推理
我们还计划在框架的后续版本中加入新特性。
与PyTorch社区合作
英特尔的维护人员积极参与PyTorch社区,以促进AI开发人员、研究人员和行业专家之间的合作与创新。主要交流活动包括:
进一步推动PyTorch开放生态系统
在把最新的优化和功能贡献到PyTorch社区之前,英特尔发布了英特尔®PyTorch*扩展包(IPEX)包含了这些优化和功能,可以让使用者更早获得加速和其他助益。扩展包以oneAPI跨体系结构编程模型为基础,只需几行代码,用户便可以利用最新的英特尔PyTorch软件和硬件优化。
此外,英特尔针对GPU的 PyTorch扩展包(IPEX)通过最新功能和优化扩展了PyTorch,从而在英特尔显卡上获得额外的性能提升。它在GitHub xpu-master分支的一个开源项目中发布。更多详情,请见发布说明。
英特尔同时也为PyTorch生态系统中的库提供技术支持,如torch-serve、PyTorch Geometric、DeepSpeed和Hugging Face Transformers(例如Accelerate、Optimum)。
英特尔加入Linux基金会AI & Data基金会
本月早些时候,英特尔还以Premier会员身份加入了Linux基金会AI & Data基金会。通过加入理事会,英特尔可以提供更多在领导开放创新和培育开发者社区的丰富经验,帮助制定基金会AI和数据工作的战略方向,以加速开源AI项目和技术的发展。
获取软件
开放的生态可以推动行业创新与加速,英特尔提供了的广泛的AI优化硬件和软件组合,赋能AI的普及。英特尔期待与合作伙伴密切协作,推动PyTorch社区和生态系统向前迈进。
试用PyTorch 2.0,感受性能提升。
访问GitHub页面,获得教程及最新的英特尔PyTorch扩展包。
PyTorch资源
产品和性能信息
1性能会因用途、配置和其他因素而异。更多信息请参见www.Intel.com/PerformanceIndex。
好文章,需要你的鼓励
Salesforce研究团队发布开源工具包MCPEval,基于模型上下文协议(MCP)架构评估AI智能体工具使用性能。该工具突破传统静态测试局限,通过全自动化流程收集详细任务轨迹和协议交互数据,为智能体行为提供前所未有的可视化分析。MCPEval能快速评估MCP工具和服务器,生成综合评估报告,为企业智能体部署提供可操作的改进建议。
清华大学团队推出AnyCap项目,通过轻量级"即插即用"框架解决多模态AI字幕生成缺乏个性化控制的问题。该项目包含模型、数据集和评估基准,能让现有AI系统根据用户需求生成定制化字幕,在不重训基础模型的情况下显著提升控制能力,为AI内容创作的个性化发展奠定基础。
月之暗面Kimi K2技术报告:解读万亿参数的智能体模型(含K2与DeepSeek R1对比)
耶鲁大学团队开发了全球首个AI科学实验设计评估系统ABGEN,测试了18个先进AI模型设计消融实验的能力。研究发现最好的AI系统得分4.11分,仍低于人类专家的4.80分,但在人机协作模式下表现显著改善。研究还发现现有自动评估系统可靠性不足,建立了元评估基准ABGEN-EVAL。这项研究为AI在科学研究中的应用提供了重要评估框架。