基本的な CUFFT の例を適切に動作させようとして、私は一日中苦労していました。しかし、特定できない小さな問題に遭遇しました。基本的に、x 座標と y 座標を持つ線形 2D 配列 vx があります。次に、順方向、次に逆方向の CUFFT (インプレース) を計算するだけです。次に、配列 vx をコピーして戻し、NX*NYで正規化してから表示します。
#define NX 32
#define NY 32
#define LX (2*M_PI)
#define LY (2*M_PI)
float *x = new float[NX*NY];
float *y = new float[NX*NY];
float *vx = new float[NX*NY];
for(int j = 0; j < NY; j++){
for(int i = 0; i < NX; i++){
x[j*NX + i] = i * LX/NX;
y[j*NX + i] = j * LY/NY;
vx[j*NX + i] = cos(x[j*NX + i]);
}
}
float *d_vx;
CUDA_CHECK(cudaMalloc(&d_vx, NX*NY*sizeof(float)));
CUDA_CHECK(cudaMemcpy(d_vx, vx, NX*NY*sizeof(float), cudaMemcpyHostToDevice));
cufftHandle planr2c;
cufftHandle planc2r;
CUFFT_CHECK(cufftPlan2d(&planr2c, NY, NX, CUFFT_R2C));
CUFFT_CHECK(cufftPlan2d(&planc2r, NY, NX, CUFFT_C2R));
CUFFT_CHECK(cufftSetCompatibilityMode(planr2c, CUFFT_COMPATIBILITY_NATIVE));
CUFFT_CHECK(cufftSetCompatibilityMode(planc2r, CUFFT_COMPATIBILITY_NATIVE));
CUFFT_CHECK(cufftExecR2C(planr2c, (cufftReal *)d_vx, (cufftComplex *)d_vx));
CUFFT_CHECK(cufftExecC2R(planc2r, (cufftComplex *)d_vx, (cufftReal *)d_vx));
CUDA_CHECK(cudaMemcpy(vx, d_vx, NX*NY*sizeof(cufftReal), cudaMemcpyDeviceToHost));
for (int j = 0; j < NY; j++){
for (int i = 0; i < NX; i++){
printf("%.3f ", vx[j*NX + i]/(NX*NY));
}
printf("\n");
}
vx が cos(x) または sin(x) として定義されている場合は問題なく動作しますが、sin(y) または cos(y) を使用すると正しい関数 (sin または cos) が返されますが、半分の振幅 (つまりつまり、1 と -1 ではなく 0.5 と -0.5 の間で振動します) ! sin(2*y) または cos(2*y) (または sin(4*y), cos(4*y), ...) を使用すると問題なく動作することに注意してください。何か案が?