多个内核在cuda 4.0中

是否有可能从cuda 4.0中的单个线程同时在多个GPU上启动多个内核?


要从单个线程使用多个GPU,您可以在cuda上下文之间切换(每个绑定都绑定到GPU)并异步启动内核。 实际上,您将以这种方式在多个GPU上运行多个内核。

但是,如果您的计算能力大于2.0的卡片,则还可以同时运行内核,如上面的注释中所示。 你可以在这里找到关于并发内核执行的文章。

当然,如果您有多个计算能力> = 2.0的卡,则可以同时使用这两个卡。


是。 如果有2个设备,则可以在device0上运行kernel1 <<< >>>,在device1上运行kernel2 <<< >>>。 有一个选项setdevice()用来选择内核将在其上执行的设备。 谷歌它,它在CUDA库4.0

链接地址: http://www.djcxy.com/p/47413.html

上一篇: Multiple kernels in cuda 4.0

下一篇: CUDA : sharing data between multiple devices?