これら 2 つのブロック サイズ (1024x1 と 32x32) は、スレッド スケジューリングとメモリ帯域幅の観点からどのように実行されると予想されますか? これら 2 つのブロック サイズのパフォーマンスに予想される違いはありますか? どちらもブロックごとに 1024 スレッドを使用することに注意してください。
1 に答える
3
スレッドブロックのディメンションは、特にブロックあたりのスレッド数が同じ場合は、それ自体がパフォーマンスに影響することはありません。
スレッドは、実行のためにワープにグループ化されます。スレッドブロック ディメンションの唯一の直接的な影響は、各スレッドに渡される 、 などの組み込み変数を変更することであり、これはパフォーマンスの問題ではありませんthreadIdx.x
。blockIdx.x
于 2014-05-12T22:45:32.240 に答える