したがって、2つのGPU間で統合仮想アドレス(UVA)コピーを実行したい場合(kind引数でcudaMemcpyAsyncを使用するのはcudaMemcopyDefaultです)、どちらのストリームを使用する必要がありますか?ソースメモリのデバイスのストリーム?または運命のメモリの開発者のストリーム?
ありがとうございました
したがって、2つのGPU間で統合仮想アドレス(UVA)コピーを実行したい場合(kind引数でcudaMemcpyAsyncを使用するのはcudaMemcopyDefaultです)、どちらのストリームを使用する必要がありますか?ソースメモリのデバイスのストリーム?または運命のメモリの開発者のストリーム?
ありがとうございました
提案:代わりにcudaMemcpyPeerAsyncを使用してください。例としてこの質問を参照してください。
私はここからあなたの質問に答えると思います:
ストリームとイベントの動作
現在のデバイスに関連付けられていないストリームにカーネルの起動またはメモリコピーが発行されると、失敗します
したがって、最近cudaSetDevice()
行った呼び出しに対応するデバイスに対応するストリームを選択してください。