0

計算機能 1.3 および 2.0 GPU カードのスケジューリング プロセスについて質問があります。ストリーミング マルチプロセッサで毎回スケジュールされる最大ブロックは、どちらの場合も 8 です。少なくとも、これは占有計算機から気づいたことです。

1.3 カードでは各 SM に 8 つのコアがあり、2.0 カードでは SM ごとに 32 コアがあります。ブロック プロセスのコアはどのように分散されますか?

1.3 の場合、各コアは 1 ブロックを処理しますか? もしそうなら、SM ごとに 8 個未満のブロックがある場合、ブロックを処理するために 1 つよりも多くのコアが割り当てられますか?

2.0 の場合、SM で 8 つのブロックがスケジュールされている場合、1 つのブロックを処理するために 4 つのコアが割り当てられますか? SM 内のブロックが少ない場合、ブロック計算用にスケジュールされるコアは多くなりますか?

ありがとうございました。

4

1 に答える 1