performance - Intel IPP に相当する ARM はありますか?

Question

特定の DSP タイプのワークロードは、Intel x86 x86_64 プロセッサで、Intel IPP ライブラリとリンクすると、パフォーマンスが大幅に向上するようです。

ARM側に似たようなものがあるのだろうか？特に、ARM9、ARM11、および Cortex-A8/A9 で動作する可能性があります (必ずしも同じレベルのパフォーマンス向上ではありません)。

最後に、この次の質問はここでは正しくない/受け入れられない可能性があるため、mods pls は親切にコメントを残してください。編集できます。

私は IPP のライセンス契約を読み込もうとしましたが、199 米ドル + 税で販売されている Linux の商用 IPP ライセンスが、ライブラリの 1 つの個人用コピー (ただし、商用利用の可能性があります) に対する権利を与えるかどうかは明確ではありません。または、アプリケーションをこのライブラリにリンクして、商業的利益のために販売できますか? それとも別の種類のライセンスが必要ですか? Intel サイトでこの質問をする場所が見つかりませんでした (Contact sales のようなものではありません) !

score 8 · Accepted Answer

また、ARM が後援するオープンソースプロジェクトNe10もあり、最初は少数の浮動小数点、ベクトル演算、および行列操作関数をカバーしています。

score 6 · Accepted Answer

あなたの質問には、あなたの見方に応じて、いくつかの答えがあります。

Intel IPP は、高速フーリエ変換などの一般的なタスクを実行するための多くの事前に調理された関数を含むライブラリです。オープンソースコミュニティには、同じことを行う特定のライブラリがあります。

FFTW (高速フーリエ変換): http://www.fftw.org/index.html
OpenCV (コンピュータービジョン): http://opencv.willowgarage.com/wiki/
LAPACK (各種線形代数): http://en.wikipedia.org/wiki/LAPACK

などなど。これらのライブラリのすべてが、さまざまな ARM コア向けに最適化されているわけではありません。

あなたの質問に対する 2 番目の角度は、大幅に異なる ARM コアで動作するものが必要な理由です。Cortex A ファミリプロセッサには、(オプションの!) ARM NEON SIMD 命令があり、(MMX/SSE/AltiVec のように) 一度にデータセットを取得し、それに複数の操作を適用できます。これにより、大量のデータを処理するために必要な命令の量が削減されます。ARM11xx ファミリには、VFP3 と呼ばれる類似のものがありますが、より制限されています。ARM9xx ファミリには、この種の最適化が本当に欠けています。それとは別に、ARM アーキテクチャには Thumb と Thumb2 があり、コードを小さく高速化できます。

最終的に、多数の ARM コアで実際に実行される最適化されたライブラリは、異なるワークロードに対して同じアルゴリズムを複数実装する必要があります。これにより、ライブラリのサイズが増加します。あなたはその代価を払っても構わないと思っていますか？

score 4 · Accepted Answer

iOS には、利用可能な場合は SIMD を使用して ARM 用に最適化された加速フレームワークがあります。こちらの Apple のドキュメントを参照してください。

performance - Intel IPP に相当する ARM はありますか?

4 に答える 4

Related

Reference