如何使用CUDA 8.0 nvprof剖析OpenCL应用程序

我试图在配有NVIDIA TITAN X和CUDA 8.0的系统中剖析OpenCL应用程序a.out

如果是CUDA应用程序, nvprof ./a.out就足够了。 但是我发现这对OpenCL应用程序不起作用,并显示消息“没有对内核进行配置”。

在CUDA 7.5之前,我在此之后成功使用了COMPUTE_PROFILE=1 。 不幸的是,文档中提到“使用环境变量COMPUTE_PROFILE的命令行分析器对CUDA 8.0版本的支持已被删除。”

问题是,除了将CUDA降级到使用nvprof配置OpenCL应用程序之外,还有其他方法吗?


据我所知, nvprof从来不支持OpenCL分析。

使用COMPUTE_PROFILE=1运行代码将调用基于驱动程序的概要分析机制,该机制早于引入nvprof 。 基于驱动程序的机制不久前已被弃用,现在已从CUDA 8中删除,转而使用nvprof

因此,似乎无法通过使用CUDA工具包来分析在NVIDIA硬件上运行的OpenCL代码。

链接地址: http://www.djcxy.com/p/94763.html

上一篇: How to profile OpenCL application with CUDA 8.0 nvprof

下一篇: SQL Developer won't show the connections Tab