CUDA 6.5 のドキュメントには次のように書かれています: http://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html#ixzz3PIXMTktb
5.2.3. マルチプロセッサ レベル
...
- コンピューティング機能 3.x で説明されているように、マルチプロセッサは一度に 4 つのワープに対して 1 クロック サイクルでワープごとにペアの命令を発行するため、コンピューティング機能 3.x のデバイスの場合は 8L です。
これは、GPU Kepler CC3.0 プロセッサがパイプライン アーキテクチャであるだけでなく、スーパースカラーでもあるということですか?
パイプライン - これら 2 つのシーケンスは並行して実行されます (一度に異なる操作)。
- LOAD [addr1] -> ADD -> STORE [addr1] -> NOP
- NOP -> LOAD [addr2] -> ADD -> STORE [addr2]
スーパースカラー - これら 2 つのシーケンスは並行して実行されます (一度に同じ操作を実行します)。
- LOAD [reg1] -> ADD -> STORE [reg1]
- LOAD [reg2] -> ADD -> STORE [reg2]