不久前,英特尔宣布以Premier会员的身份加入PyTorch*基金会,并期待与各行各业的领军企业在开源PyTorch框架和生态系统上开展合作。PyTorch能够加速人工智能应用的开发,这将促进试验与创新,在加速AI发展方面发挥关键作用。加入PyTorch基金会,进一步彰显了英特尔致力于通过技术支持并培育其生态系统以加速机器学习框架的演进。
英特尔自2018年起为PyTorch提供支持,旨在通过丰富的硬件和开放的软件推动AI普及。英特尔正在不断推进PyTorch并拓展生态,以创新为先,推动构建一个“AI触手可及”的未来。
英特尔通过优化,提升PyTorch* 2.0功能
PyTorch受益于英特尔为x86提供的诸多优化,包括利用英特尔® oneAPI深度神经网络库(oneDNN)加速PyTorch,针对aten算子和BFloat16的优化,以及自动混合精度支持。英特尔也积极参与PyTorch通用功能(如量化和编译器)的设计与部署,为PyTorch 2.0提供了四个重要性能特性:
1. 优化TorchInductor CPU FP32推理
2. 在PyG中改进图神经网络(GNN),以支持推理和训练性能
3. 针对x86 CPU平台,优化了统一量化后端的int8推理
4. 利用oneDNN Graph API加速在CPU上的推理
我们还计划在框架的后续版本中加入新特性。
与PyTorch社区合作
英特尔的维护人员积极参与PyTorch社区,以促进AI开发人员、研究人员和行业专家之间的合作与创新。主要交流活动包括:
进一步推动PyTorch开放生态系统
在把最新的优化和功能贡献到PyTorch社区之前,英特尔发布了英特尔®PyTorch*扩展包(IPEX)包含了这些优化和功能,可以让使用者更早获得加速和其他助益。扩展包以oneAPI跨体系结构编程模型为基础,只需几行代码,用户便可以利用最新的英特尔PyTorch软件和硬件优化。
此外,英特尔针对GPU的 PyTorch扩展包(IPEX)通过最新功能和优化扩展了PyTorch,从而在英特尔显卡上获得额外的性能提升。它在GitHub xpu-master分支的一个开源项目中发布。更多详情,请见发布说明。
英特尔同时也为PyTorch生态系统中的库提供技术支持,如torch-serve、PyTorch Geometric、DeepSpeed和Hugging Face Transformers(例如Accelerate、Optimum)。
英特尔加入Linux基金会AI & Data基金会
本月早些时候,英特尔还以Premier会员身份加入了Linux基金会AI & Data基金会。通过加入理事会,英特尔可以提供更多在领导开放创新和培育开发者社区的丰富经验,帮助制定基金会AI和数据工作的战略方向,以加速开源AI项目和技术的发展。
获取软件
开放的生态可以推动行业创新与加速,英特尔提供了的广泛的AI优化硬件和软件组合,赋能AI的普及。英特尔期待与合作伙伴密切协作,推动PyTorch社区和生态系统向前迈进。
试用PyTorch 2.0,感受性能提升。
访问GitHub页面,获得教程及最新的英特尔PyTorch扩展包。
PyTorch资源
产品和性能信息
1性能会因用途、配置和其他因素而异。更多信息请参见www.Intel.com/PerformanceIndex。
好文章,需要你的鼓励
谷歌CEO皮查伊在AI竞赛低谷期坚持"信号降噪"原则,顶住压力加倍投入,最终带领谷歌凭借Gemini系列重夺领先。他坚信AI将超越火与电的革命性影响,通过递归自我改进极大降低创意实现门槛,这场"创造力民主化"浪潮或将解锁80亿人的认知潜能。
浙江大学和吉利汽车研究院联合团队提出的FreeTimeGS是一种创新的动态3D场景重建方法。不同于传统方法,它允许高斯基元在任意时空位置自由出现,并赋予每个基元运动功能,使其能够随时间移动到相邻区域。研究通过4D正则化策略解决了高不透明度基元阻碍优化的问题。在多个数据集测试中,该方法在渲染质量和速度上均大幅超越现有技术,特别是在处理复杂动态场景时,使用单个RTX 4090 GPU能以467 FPS的速度实现1080p实时渲染,为电影制作、游戏和虚拟现实等应用提供了新可能。
李飞飞的World Labs以"空间智能"重新定义AI,专注3D物理世界理解,4个月估值飙至10亿美元,获科技巨头集体押注。她揭示语言无法编码物理世界,而DNA双螺旋等突破性发现都源于三维空间的深度认知。
这篇研究介绍了"对角线批处理"技术,该技术解决了循环记忆Transformer模型在处理长文本时的并行计算瓶颈。通过重新编排计算顺序,研究团队实现了在不破坏依赖关系的情况下进行并行计算,使LLaMA-1B模型处理长文本的速度提升3.3倍,同时内存使用减少167.1倍。这种纯运行时优化不需要重新训练模型,为实际应用中的长文本处理提供了高效解决方案。