FTTW に対するベンチマークのために、ここにあるハライド FFT 実装を実行しようとしています。実装をそのまま実行することはできますが、もう少し深く掘り下げると、いくつかの問題が発生しました。ルーチンは、H と W (ランダムな入力画像の高さと幅) の値が異なるため、エラーで失敗します。たとえば、H=W=5 で次のエラーが発生します。
Error at ./fft.cpp:603:
Cannot vectorize dimension n0 of function v_S1_R5$6 because the function is scheduled inline.
Aborted (core dumped)
アルゴリズムの結果を比較するために小さな画像サイズ (つまり 5x5) でテストしようとしましたが、アルゴリズムを 16 未満の値で完了することはできません。長い仕事。FFT は 32 より大きい値でも失敗します。
以前にこの問題に遭遇した人はいますか? 異なるサイズの画像で機能する、ハライドでの FFT の他の実装はありますか?
参考までに、gcc 4.8.3 を使用して RHEL7 でコードを実行しています。