如何使用CUDA 8.0 nvprof剖析OpenCL应用程序
我试图在配有NVIDIA TITAN X和CUDA 8.0的系统中剖析OpenCL应用程序a.out
。
如果是CUDA应用程序, nvprof ./a.out
就足够了。 但是我发现这对OpenCL应用程序不起作用,并显示消息“没有对内核进行配置”。
在CUDA 7.5之前,我在此之后成功使用了COMPUTE_PROFILE=1
。 不幸的是,文档中提到“使用环境变量COMPUTE_PROFILE的命令行分析器对CUDA 8.0版本的支持已被删除。”
问题是,除了将CUDA降级到使用nvprof配置OpenCL应用程序之外,还有其他方法吗?
据我所知, nvprof
从来不支持OpenCL分析。
使用COMPUTE_PROFILE=1
运行代码将调用基于驱动程序的概要分析机制,该机制早于引入nvprof
。 基于驱动程序的机制不久前已被弃用,现在已从CUDA 8中删除,转而使用nvprof
。
因此,似乎无法通过使用CUDA工具包来分析在NVIDIA硬件上运行的OpenCL代码。
链接地址: http://www.djcxy.com/p/94763.html