Intel MIC プラットフォームでネイティブに実行する 3 次元 FFT (MKL インターフェイス) の C コードを開発しました。
複素数から複素数への変換では、データ要素は倍精度複素数です。私はパディングされた主要な次元、mkl_malloc() 64 バイト アラインメントを使用し、配列に基数 2 の次元を使用しています。最終的に得られるパフォーマンスは約 50 Gflop/s です。
同様のタイプの変換のパフォーマンス リストはどこにもありません。Xeon Phiでこれが(満足できる)合理的かどうか誰か教えてもらえますか?