【IT168 资讯】上千上万的开发人员现在即可拥有全新支持Windows 和 Linux 的OpenCL可视化剖析器。
利用NVIDIA OpenCL驱动器内的强大性能实质和NVIDIA GPU内的硬件性能信号,OpenCL可视化剖析器为开发人员提供了解决性能瓶颈的视角和优化的机会。
关键特点:
真实硬件信号,核心效能和指令发送率的程序剖析;
系统内存和GPU专用内存之间内存拷贝的时序;
自定义图标以帮助开发人员专注于解决问题;
基本的自动分析以揭示warp 串行化问题;
轻松输入/输出CSV,进行定制分析;
NVIDIA还设计了颇有用处的OpenCL Best Practices Guide(OpenCL最佳实务指南)以帮助为CUDA构架编程的OpenCL开发人员执行高性能平行演算法,及理解GPU计算的最佳实务。
在指南里,以下课题和其它细节在各章节均会讨论:
用OpenCL 进行GPU计算;
性能测度;
内存优化;
NDRange优化;
指令优化;
控制流程;
性能优化战略
现在,所有注册NVIDIA GPU计算项目开发人员都可拥有OpenCL可视化剖析器,也会包含在随后公开发型的CUDA Toolkit里。在http://www.nvidia.com/content/cudazone/CUDABrowser/downloads/papers/NVIDIA_OpenCL_BestPracticesGuide.pdf
可获得OpenCL最佳实务指南;
专业开发人员和研究人员,欢迎在以下网址申请该程序: