コードスニペット
cudaEventRecord(start, 0);
/* creates 1D FFT plan */
cufftPlan1d(&plan, NX, CUFFT_C2C, BATCH);
/* executes FFT processes */
cufftExecC2C(plan, devPtr, devPtr, CUFFT_FORWARD);
cudaEventRecord(stop, 0);
cudaEventSynchronize(stop);
cuFFT が計画を作成するのに必要な時間と実行時間の両方を測定します。
計画の作成に必要な時間を含めずに、実行時間のみを測定するにはどうすればよいですか?