2

Intel MIC プラットフォームでネイティブに実行する 3 次元 FFT (MKL インターフェイス) の C コードを開発しました。

複素数から複素数への変換では、データ要素は倍精度複素数です。私はパディングされた主要な次元、mkl_malloc() 64 バイト アラインメントを使用し、配列に基数 2 の次元を使用しています。最終的に得られるパフォーマンスは約 50 Gflop/s です。

同様のタイプの変換のパフォーマンス リストはどこにもありません。Xeon Phiでこれが(満足できる)合理的かどうか誰か教えてもらえますか?

4

1 に答える 1

2

結果は問題ないようです。

Intel が提供する Xeon Phi の 2-D float データを使用したFFT チューニング ガイドでは、100Gflops のピーク パフォーマンスが示されています。したがって、ダブルデータで 50Gflops は妥当なはずです。

質問で言及されている要因に加えて、主要な寸法、パディング、スレッド数、アフィニティなどの要因もパフォーマンスに大きな影響を与えます。

詳細については、これらの Intel ドキュメントを参照してください。

Xeon phi 上の MKL のドキュメント リスト

http://software.intel.com/en-us/articles/intel-mkl-on-the-intel-xeon-phi-coprocessors

xeon phi で MKL を使用する際のパフォーマンスのヒント

http://software.intel.com/en-us/articles/performance-tips-of-using-intel-mkl-on-intel-xeon-phi-coprocessor

xeon phi での dft 関数のチューニング

http://software.intel.com/en-us/articles/tuning-the-intel-mkl-dft-functions-performance-on-intel-xeon-phi-coprocessors

于 2013-09-24T16:26:26.137 に答える