多个内核在cuda 4.0中
是否有可能从cuda 4.0中的单个线程同时在多个GPU上启动多个内核?
要从单个线程使用多个GPU,您可以在cuda上下文之间切换(每个绑定都绑定到GPU)并异步启动内核。 实际上,您将以这种方式在多个GPU上运行多个内核。
但是,如果您的计算能力大于2.0的卡片,则还可以同时运行内核,如上面的注释中所示。 你可以在这里找到关于并发内核执行的文章。
当然,如果您有多个计算能力> = 2.0的卡,则可以同时使用这两个卡。
是。 如果有2个设备,则可以在device0上运行kernel1 <<< >>>,在device1上运行kernel2 <<< >>>。 有一个选项setdevice()用来选择内核将在其上执行的设备。 谷歌它,它在CUDA库4.0
链接地址: http://www.djcxy.com/p/47413.html