-8

このように、ブロックごとに 1 つのスレッドでカーネルを実行します<<<NUMBER_OF_BLOCKS, 1>>>

私の GPU では (によるとdeviceQuery) 512 ブロックしか実行できません。したがって、NUMBER_OF_BLOCKS<= 512 の場合にのみ機能するはずですが、32768 ブロックを実行してもプログラムは機能します。65536 ブロック以上を実行すると、悪い結果が表示されます。

私は何を取りこぼしたか?

4

1 に答える 1