0

CUDAで動的並列処理を使用すると、 mergeSortなどの再帰アルゴリズムを実装できます。私はそれを実装しましたが、私のプログラムはblahより大きい入力に対しては機能しません。 私の質問は、実装が再帰ツリーでどれくらいの深さまで進むことができるかということです. 制限はありますか?(私のプログラムは、小さな入力には問題ありません。)

4

1 に答える 1

2

プロのCUDA Cプログラミングから:

動的並列処理のネストの最大深度は 24 に制限されていますが、実際には、ほとんどのカーネルは、新しいレベルごとにデバイス ランタイム システムが必要とするメモリ量によって制限されます。. .

于 2015-01-03T20:27:03.160 に答える