こんにちは、CUDA でのプログラミングについて疑問があります。次のコードがあります。
int main () {
for (;;) {
kernel_1 (x1, x2, ....);
kernel_2 (x1, x2 ...);
kernel_3_Reduction (x1);
// code manipulation host_x1
// Copy the pointer device to host
cpy (host_x1, x1, DeviceToHost)
cpu_code_x1_manipulation;
kernel_ (x1, x2, ....);
}
}
では、コピーがいつ作成され、kernel_1、kernel_2、kernel_3 がタスクを完了したことを確認するにはどうすればよいでしょうか?