0

CPU と CUDA GPU の変数にアクセスする必要があります。現在、カーネルの終了後にその変数を CPU に転送していますが、アプリケーションのボトルネックになっています。GPU が実行を終了した後、CPU 上の変数にアクセスするより高速な方法はありますか? 固定されたメモリはここで役立ちますか?

4

1 に答える 1

1

固定メモリを使用する必要があるかどうかを尋ねているため、使用していないと思います。これは、固定メモリが必要になるため、非同期 memcpy を実行していないことも意味します。

したがって、あなたの質問に答えるには: はい、固定メモリを使用し、ストリームと非同期メモリ転送関数を使用して、できるだけ早く結果を取得する必要があります。

http://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html#asynchronous-concurrent-executionおよびhttp://docs.nvidia.com/cuda/cuda-c-programmingも参照してください。 -guide/index.html#page-locked-host-memory

于 2013-02-11T18:39:53.187 に答える