cuda - この CUDA コードは順番どおりに非同期で実行されますか?

翻译自：https://stackoverflow.com/questions/16337421 2013-05-02T11:53:51.683

287 次

1

以下のコードは順番に実行されますか? ( のデバイス間コピーを入れることはできませcudaMemcpy2DArrayToArray()んstream)
以下のコードは非同期で実行されますか? (cudaMemcpy2DArrayToArray()対応する非同期はありません)

コードサンプルをより効率的に実装できることはわかっていますが、これは単なる例として意図されたものです。

for( i=0; i<10; i++ )
{
    cudaMemcpy2DArrayToArray( dst, src );                   // device to device copy.
    cudaBindTextureToArray( texture_reference, dst, ... )   // bind dst to texture.
    kernel<<< dimGrid, dimBlock, 0, stream >>>( out )       // compute an array.
    cudaMemcpy2DToArrayAsync( src_p, out, stream )          // copy result to src.
}

1 に答える 1