CUDA カーネルを別々のストリームに入れることで「オーバーラップ」できることは知っていますが、カーネルの実行中にメモリを転送できるかどうか疑問に思っています。結局、CUDAカーネルは非同期です
質問する
328 次
2 に答える
2
カーネル、ホストからデバイスへの転送、およびデバイスからホストへの転送を同時に実行できます。
http://developer.download.nvidia.com/CUDA/training/StreamsAndConcurrencyWebinar.pdf
于 2012-04-19T22:23:41.127 に答える
1
明確にするために、上記はデバイスがサポートしている場合にのみ有効です。デバイスクエリを実行し、属性の同時コピーと実行を確認して確認できます
于 2012-04-20T16:07:51.113 に答える