ユーザーが を渡してthreads_per_block
カーネルを呼び出すコードがあるとします。次に、入力が有効かどうかを確認します (たとえば、計算能力 CC <2.0 の場合は <=512、CC >=2.0 の場合は 1024)。
nvcc -arch=sm_13
CC2.0 を搭載したコンピューターにグラフィックス カードを搭載しているときに、ユーザーがパスしたときにコードをコンパイルするとどうなるのだろうかthreads_per_block == 1024
? これは:
- 有効な入力 - 私が使用しているカードには CC2.0 があるため、または...
- CC1.3用にコンパイルしたので無効?
それともnvcc -arch=sm_13
、少なくとも CC1.3 は必要ですが、より高い CC で実行すると、それらのより高い機能を使用できるということですか?