不久前,英特尔宣布以Premier会员的身份加入PyTorch*基金会,并期待与各行各业的领军企业在开源PyTorch框架和生态系统上开展合作。PyTorch能够加速人工智能应用的开发,这将促进试验与创新,在加速AI发展方面发挥关键作用。加入PyTorch基金会,进一步彰显了英特尔致力于通过技术支持并培育其生态系统以加速机器学习框架的演进。
英特尔自2018年起为PyTorch提供支持,旨在通过丰富的硬件和开放的软件推动AI普及。英特尔正在不断推进PyTorch并拓展生态,以创新为先,推动构建一个“AI触手可及”的未来。
英特尔通过优化,提升PyTorch* 2.0功能
PyTorch受益于英特尔为x86提供的诸多优化,包括利用英特尔® oneAPI深度神经网络库(oneDNN)加速PyTorch,针对aten算子和BFloat16的优化,以及自动混合精度支持。英特尔也积极参与PyTorch通用功能(如量化和编译器)的设计与部署,为PyTorch 2.0提供了四个重要性能特性:
1. 优化TorchInductor CPU FP32推理
2. 在PyG中改进图神经网络(GNN),以支持推理和训练性能
3. 针对x86 CPU平台,优化了统一量化后端的int8推理
4. 利用oneDNN Graph API加速在CPU上的推理
我们还计划在框架的后续版本中加入新特性。
与PyTorch社区合作
英特尔的维护人员积极参与PyTorch社区,以促进AI开发人员、研究人员和行业专家之间的合作与创新。主要交流活动包括:
进一步推动PyTorch开放生态系统
在把最新的优化和功能贡献到PyTorch社区之前,英特尔发布了英特尔®PyTorch*扩展包(IPEX)包含了这些优化和功能,可以让使用者更早获得加速和其他助益。扩展包以oneAPI跨体系结构编程模型为基础,只需几行代码,用户便可以利用最新的英特尔PyTorch软件和硬件优化。
此外,英特尔针对GPU的 PyTorch扩展包(IPEX)通过最新功能和优化扩展了PyTorch,从而在英特尔显卡上获得额外的性能提升。它在GitHub xpu-master分支的一个开源项目中发布。更多详情,请见发布说明。
英特尔同时也为PyTorch生态系统中的库提供技术支持,如torch-serve、PyTorch Geometric、DeepSpeed和Hugging Face Transformers(例如Accelerate、Optimum)。
英特尔加入Linux基金会AI & Data基金会
本月早些时候,英特尔还以Premier会员身份加入了Linux基金会AI & Data基金会。通过加入理事会,英特尔可以提供更多在领导开放创新和培育开发者社区的丰富经验,帮助制定基金会AI和数据工作的战略方向,以加速开源AI项目和技术的发展。
获取软件
开放的生态可以推动行业创新与加速,英特尔提供了的广泛的AI优化硬件和软件组合,赋能AI的普及。英特尔期待与合作伙伴密切协作,推动PyTorch社区和生态系统向前迈进。
试用PyTorch 2.0,感受性能提升。
访问GitHub页面,获得教程及最新的英特尔PyTorch扩展包。
PyTorch资源
产品和性能信息
1性能会因用途、配置和其他因素而异。更多信息请参见www.Intel.com/PerformanceIndex。
好文章,需要你的鼓励
这项研究开发了CaptionQA系统,通过测试AI生成的图片描述能否支持实际任务来评估其真正价值。研究发现即使最先进的AI模型在图片描述实用性方面也存在显著不足,描述质量比直接看图时下降9%-40%。研究涵盖自然、文档、电商、机器人四个领域,为AI技术的实用性评估提供了新标准。
AI改变的远不止一间课堂,而是学生的学习方式、未来的职场场景和社会对工作者能力的要求,整个商业文明中的每一位参与者,都将被推着一起改变。
以色列理工学院研究团队提出了一种将专家混合模型融入YOLOv9目标检测的创新方法。该方法让多个专门化的YOLOv9-T专家分工协作,通过智能路由器动态选择最适合的专家处理不同类型图像。实验显示,在COCO数据集上平均精度提升超过10%,在VisDrone数据集上提升近30%,证明了"分工合作"比单一模型更有效,为AI视觉系统提供了新思路。