- 以下のコードは順番に実行されますか? ( のデバイス間コピーを入れることはできませ
cudaMemcpy2DArrayToArray()
んstream
) - 以下のコードは非同期で実行されますか? (
cudaMemcpy2DArrayToArray()
対応する非同期はありません)
コード サンプルをより効率的に実装できることはわかっていますが、これは単なる例として意図されたものです。
for( i=0; i<10; i++ )
{
cudaMemcpy2DArrayToArray( dst, src ); // device to device copy.
cudaBindTextureToArray( texture_reference, dst, ... ) // bind dst to texture.
kernel<<< dimGrid, dimBlock, 0, stream >>>( out ) // compute an array.
cudaMemcpy2DToArrayAsync( src_p, out, stream ) // copy result to src.
}