0

ipad1 と ipad2 で NEON 命令をテストすると、ほとんどの関数が ipad1 よりも ipad2 ではるかに高速に実行される ipad2 のコードで速度がほとんど向上しないことに気付きました。

これは、FFT などの q0 などのクワッド ワード レジスタを使用する VMUL、VLD1、VADD、VSUB などの命令用です。

さらに、リンゴ独自の FFT 関数 vdsp_fft_zrip も ipad2 で高速化されないことに気付きました。

問題は、ipad2 NEON は、クワッド ワード SIMD タイプの命令で ipad1 NEON エンジンよりも高速に実行されるかということです。

4

2 に答える 2

1

A4 の NEON ユニットは、他のコアに比べて非常に強力でした。A5 のコアの残りの部分は A4 から大幅に改善されていますが、NEON ユニットのパフォーマンスは多かれ少なかれ変わっていません。あなたが観察していることは期待されています。

もちろん、コアが 2 つになったので、両方を活用できれば、大幅な高速化が見込めます。また、A5 の倍精度計算は、完全にパイプライン化されているため、A4 から大幅に改善されています。

于 2011-11-04T13:14:10.190 に答える
0

NEONは、最近導入された64ビットARMでも、かなり長い間同じままです。

NEONは、クロック速度の向上によるメリットはあまりありません。NEONはすでに非常に高速であるため、関数の実行時間の大部分をメモリからのデータの待機に費やしています。

于 2011-11-02T11:46:22.413 に答える