3

8 つのスレッドブロックがあり、GPU に 8 つの SM があるとします。では、GPU はどのようにしてこのスレッドブロックを SM に発行するのでしょうか?

いくつかのプログラムまたは記事で、幅優先の方法、つまり、この例では各 SM がスレッドブロックを実行することを示唆していることがわかりました。ただし、いくつかのドキュメントによると、GPU カーネルのレイテンシーが制限されている場合は、占有率を増やすことをお勧めします。可能であれば、8 つのスレッドブロックが 4 つ以下の SM で実行されると推測される場合があります。

どれが現実なのか気になります。前もって感謝します。

4

2 に答える 2

2

GPU が正確に何をしているのかを伝えるのは困難です。興味のある特定のカーネルがある場合は、%smid各ブロックのレジスタを読み取って保存してみてください。

これを行う方法の例をここに示します。

于 2013-02-03T15:35:15.277 に答える