私は次元 Nx*Ny*Nz の実際の 3D 配列を持っており、 FFTW を使用して各 z 値に対して 2D フーリエ変換を行いたいと考えています。ここで、z インデックスはメモリ内で最も速く変化します。現在、次のコードは期待どおりに機能します。
int Nx = 16; int Ny = 8; int Nz = 3;
// allocate memory
const int dims = Nx * Ny * Nz;
// input data (pre Fourier transform)
double *input = fftw_alloc_real(dims);
// why is this the required output size?
const int outdims = Nx * (Ny/2 + 1) * Nz;
// we want to perform the transform out of place
// (so seperate array for output)
fftw_complex *output = fftw_alloc_complex(outdims);
// setup "plans" for forward and backward transforms
const int rank = 2; const int howmany = Nz;
const int istride = Nz; const int ostride = Nz;
const int idist = 1; const int odist = 1;
int n[] = {Nx, Ny};
int *inembed = NULL, *onembed = NULL;
fftw_plan fp = fftw_plan_many_dft_r2c(rank, n, howmany,
input, inembed, istride, idist,
output, onembed, ostride, odist,
FFTW_PATIENT);
fftw_plan bp = fftw_plan_many_dft_c2r(rank, n, howmany,
output, onembed, ostride, odist,
input, inembed, istride, idist,
FFTW_PATIENT);
私が理解しているように、長さ N の 1D シーケンスを変換するには (N/2 + 1) の複雑な値が必要ですが、代わりにoutdims = (Nx/2 + 1)*(Ny/2 + 1)*Nz
2D 変換に期待されるように設定すると、上記のコードがクラッシュするのはなぜですか?
qx = 0 to Nx/2
第二に、次を使用して(包括的)からモードの実数部と虚数部にアクセスできると考えているのは正しいです:
#define outputRe(qx,qy,d) ( output[(d) + Nz * ((qy) + (Ny/2 + 1) * (qx))][0] )
#define outputIm(qx,qy,d) ( output[(d) + Nz * ((qy) + (Ny/2 + 1) * (qx))][1] )
EDIT:遊びたい人のための完全なコードとMakefile 。fftw と gsl がインストールされていることを前提としています。
EDIT2:私が正しく理解していれば、インデックス付け(正と負の周波数を許可する)は次のようになります(おそらくマクロには乱雑になりすぎます!):
#define outputRe(qx,qy,d) ( output[(d) + Nz * ((qy) + (Ny/2 + 1) * ( ((qx) >= 0) ? (qx) : (Nx + (qx)) ) ) ][0] )
#define outputIm(qx,qy,d) ( output[(d) + Nz * ((qy) + (Ny/2 + 1) * ( ((qx) >= 0) ? (qx) : (Nx + (qx)) ) ) ][1] )
for (int qx = -Nx/2; qx < Nx/2; ++qx)
for (int qy = 0; qy <= Ny/2; ++qy)
outputRe(qx, qy, d) = ...
whereoutputRe(-Nx/2, qy, d)
は と同じデータを指しますoutputRe(Nx/2, qy, d)
。実際には、おそらく最初のインデックスをループして周波数に変換するだけで、その逆ではありません!