各 SM に 48 コアの 4 つの SM を持つ GTS 450 があります。つまり、192 個の CUDA コア
限られたレジスタ メモリと共有メモリを使用していると考えてください。
コンピューティング機能 2.1 では、100% の占有率を達成するための最適なブロック サイズとスレッド サイズはどれくらいになるでしょうか?
各 SM に 48 コアの 4 つの SM を持つ GTS 450 があります。つまり、192 個の CUDA コア
限られたレジスタ メモリと共有メモリを使用していると考えてください。
コンピューティング機能 2.1 では、100% の占有率を達成するための最適なブロック サイズとスレッド サイズはどれくらいになるでしょうか?
まだダウンロードしていない場合は、適切な CUDA ツールキット (v5.0)をダウンロードし、 CUDA Occupancy Calculatorの Excel シートを探す必要があります。その場合は、上記の文書を使用してください。初期のプロパティ/パラメータを設定すると、100% または任意の占有率を達成する方法がわかります。そのうちの 1 つは、コンピューターの能力です。これは私が言う最も重要なことでもあります。