1
  • 以下のコードは順番に実行されますか? ( のデバイス間コピーを入れることはできませcudaMemcpy2DArrayToArray()stream)
  • 以下のコードは非同期で実行されますか? (cudaMemcpy2DArrayToArray()対応する非同期はありません)

コード サンプルをより効率的に実装できることはわかっていますが、これは単なる例として意図されたものです。

for( i=0; i<10; i++ )
{
    cudaMemcpy2DArrayToArray( dst, src );                   // device to device copy.
    cudaBindTextureToArray( texture_reference, dst, ... )   // bind dst to texture.
    kernel<<< dimGrid, dimBlock, 0, stream >>>( out )       // compute an array.
    cudaMemcpy2DToArrayAsync( src_p, out, stream )          // copy result to src.
}
4

1 に答える 1