GPUにディスパッチできるスレッド/スレッドグループの「グリッド」について疑問に思っています。私はDirectComputeを使用しているので、そのAPIを使用した具体的な例を示します。たとえば、Dispatch(2,2,2)を呼び出すと、合計2x2x2=8のスレッドグループがディスパッチされることがわかります。ただし、Dispatch(8,1,1)を呼び出すと、8x1x1 = 8スレッドグループもディスパッチする場合の違いは何ですか?パフォーマンスに違いはありますか?
GPU上のスレッドに関するPSの同じ質問。計算(.hlsl)ファイルで宣言されたnumthreads(2,2,2)とnumthreads(8,1,1)の違いは何ですか?
どんな助けでもいただければ幸いです。