3

私は IPP 6 を所有していますが、IPP 8 が既に利用可能であることを確認しました。最新の CPU で IPP 6、7、および 8 を比較するためのベンチマークはありますか? 特に 1D 基本演算 (mul、add、complex)、FFT および IIR フィルタリングの場合。

4

1 に答える 1

2

自分で実験を行うことができます。IPP にはパフォーマンス測定ユーティリティが付属しており、通常は ipp\tools\perfsys ディレクトリにある「ps*.exe」です。IPP 6.x の時点でどうだったかを言うのは難しいですが、似ているはずです。「ps*.exe」実行可能ファイルを使用すると、さまざまな CPU 最適化について、特定の IPP 関数のパフォーマンスを要素あたりのクロック数 (もちろん、低いほど良い) で測定できます。これらのパフォーマンスの基本的なオプション。tests は "-?"、"-e" は test 内のすべての関数を表示、"-T" は特定の CPU 最適化のみを有効にし、"-r" は出力を csv ファイルに保存します。

AVX、SSE41、および SSE3 CPU の ippsIIR64f_32s_Sfs 関数を測定するとします。ps_ipps.exe (1D ドメインのパフォーマンス テスト) を 3 回起動する必要があります。

ps_ipps.exe -fippsIIR64f_32s_Sfs -B -R -TAVX    (you'll get csv file with AVX optimization results)
ps_ipps.exe -fippsIIR64f_32s_Sfs -B -R -TSSE41  (SSE4.1 perf. data will be appended to csv)
ps_ipps.exe -fippsIIR64f_32s_Sfs -B -R -TSSE3"   (SSE3 performance data will be appended).

次に、必要な関数/引数の組み合わせのgrep csvファイル。

find "ippsIIR64f,32s,Sfs,32768,6,numBq_DF1" ps_ipps.csv

たとえば、私は得る

ippsIIR64f,32s,Sfs,32768,6,numBq_DF1,-,-,0,nLps=2048,1.30,cpMac,512,-
ippsIIR64f,32s,Sfs,32768,6,numBq_DF1,-,-,0,nLps=8,1.56,cpMac,613,-
ippsIIR64f,32s,Sfs,32768,6,numBq_DF1,-,-,0,nLps=4,5.61,cpMac,2.21e+003,-

つまり、SSE3 では 5.61 クロック、SSE4.1 では 1.56 クロック、AVX では 1.30 クロックです。CPU は、測定する最高の命令セットをサポートする必要があります。IPP 7 および 8 に関しては、Intel 製品 (Composer または Parallel Studio) の「試用版」バージョンを Intel サイトからダウンロードして、ベンチマークを実行できます。

于 2014-12-17T13:58:15.913 に答える