__global__ void helloCUDA(float f)
{
printf("Hello thread %d, f=%f\n", threadIdx.x, f);
}
int main()
{
helloCUDA<<<1, 5>>>(1.2345f);
cudaDeviceSynchronize();
return 0;
}
なぜ cudaDeviceSynchronize(); たとえばここの多くの場所 では、カーネル呼び出しの後は必要ありませんか?