3

CUDA カーネルを別々のストリームに入れることで「オーバーラップ」できることは知っていますが、カーネルの実行中にメモリを転送できるかどうか疑問に思っています。結局、CUDAカーネルは非同期です

4

2 に答える 2

2

カーネル、ホストからデバイスへの転送、およびデバイスからホストへの転送を同時に実行できます。

http://developer.download.nvidia.com/CUDA/training/StreamsAndConcurrencyWebinar.pdf

于 2012-04-19T22:23:41.127 に答える
1

明確にするために、上記はデバイスがサポートしている場合にのみ有効です。デバイスクエリを実行し、属性の同時コピーと実行を確認して確認できます

于 2012-04-20T16:07:51.113 に答える