私はcudaプログラミングが初めてです。私は持っているケプラーGPUに取り組んでいます
3.2 compute_capability
1024 max_threads_per_block
1 Multiprocessor
2048 max._threads per_Multiprocessor
2147483647 grid size
これは、カーネルに 2048 しか割り当てられないということですか? では、その大きなグリッド サイズをどうするか?
私のアプリケーションには、大量の行列計算が含まれています。