关于CUDA的架构(SM,SP)

我是刚开始CUDA编程的人。
似乎有一个SP SM和CUDA架构的概念。
我试图运行示例源deviceQuery.cpp我认为什么可以和SP SM开发他们的环境,
它已经不知道哪些项目是否是SM中的任何项目。

我认为项目“(14)多处理器,(8)CUDA核心/ MP”,这是真实的SP和SM,但我会正确理解以下内容?

SM =多处理器= 14
SP = CUDA Cores / MP = 8
CUDA核心= 14 * 8 = 112

顺便说一下,deviceQuery.cpp的结果如下。

CUDA设备查询(运行时API)版本(CUDART静态链接)

检测到1个支持CUDA的设备

设备0:“GeForce GTS 240
CUDA驱动程序版本/运行版本5.5 / 5.5
CUDA能力主要/次要版本号:1.1
全局内存总量:1024兆字节(1073741824字节)
(14)多处理器,(8)CUDA内核/ MP:112个CUDA内核
GPU时钟频率:1620 MHz(1.62 GHz)
内存时钟频率:1100 Mhz
内存总线宽度:256位
最大纹理尺寸大小(x,y,z)1D =(8192),2D =(65536,32768),3
D =(2048,2048,2048)
最大分层1D纹理大小,(num)层1D =(8192),512层
最大分层2D纹理大小,(num)层2D =(8192,8192),512层
常量内存总量:65536字节
每块的共享内存总量:16384字节
每个块可用的寄存器总数:8192
经线尺寸:32
每个多处理器的最大线程数:768
每块的最大线程数:512
线程块(x,y,z)的最大维度大小:(512,512,64)
网格大小(x,y,z)的最大维度大小:(65535,65535,1)
最大存储器间距:2147483647字节
纹理对齐:256字节
并发复制和内核执行:是,带有1个复制引擎
对内核运行时间限制:是的
集成GPU共享主机内存:否
支持主机页锁内存映射:是的
曲面的对齐要求:是
设备有ECC支持:已禁用
设备支持统一寻址(UVA):否
设备PCI总线ID / PCI位置ID:9/0
计算模式:
<默认(多个主机线程可以同时使用:: cudaSetDevice()和设备模拟)>


据此,你是正确的:

SM =流式多处理器

SP =流媒体处理器= CUDA核心

SP / CUDA核心总数=每个SM的SP / CUDA核心的SM *数量

链接地址: http://www.djcxy.com/p/38471.html

上一篇: About CUDA's architecture (SM, SP)

下一篇: Cuda not giving correct answer when array size is larger than 1,000,000