cuda - SM コアを使用した GPU カードのブロック処理パターン

翻译自：https://stackoverflow.com/questions/16524579 2013-05-13T14:30:10.040

73 次

計算機能 1.3 および 2.0 GPU カードのスケジューリングプロセスについて質問があります。ストリーミングマルチプロセッサで毎回スケジュールされる最大ブロックは、どちらの場合も 8 です。少なくとも、これは占有計算機から気づいたことです。

1.3 カードでは各 SM に 8 つのコアがあり、2.0 カードでは SM ごとに 32 コアがあります。ブロックプロセスのコアはどのように分散されますか?

1.3 の場合、各コアは 1 ブロックを処理しますか? もしそうなら、SM ごとに 8 個未満のブロックがある場合、ブロックを処理するために 1 つよりも多くのコアが割り当てられますか?

2.0 の場合、SM で 8 つのブロックがスケジュールされている場合、1 つのブロックを処理するために 4 つのコアが割り当てられますか? SM 内のブロックが少ない場合、ブロック計算用にスケジュールされるコアは多くなりますか?

ありがとうございました。

1 に答える 1