9

特定の DSP タイプのワークロードは、Intel x86 x86_64 プロセッサで、Intel IPP ライブラリとリンクすると、パフォーマンスが大幅に向上するようです。

ARM側に似たようなものがあるのだろうか?特に、ARM9、ARM11、および Cortex-A8/A9 で動作する可能性があります (必ずしも同じレベルのパフォーマンス向上ではありません)。

最後に、この次の質問はここでは正しくない/受け入れられない可能性があるため、mods pls は親切にコメントを残してください。編集できます。

私は IPP のライセンス契約を読み込もうとしましたが、199 米ドル + 税で販売されている Linux の商用 IPP ライセンスが、ライブラリの 1 つの個人用コピー (ただし、商用利用の可能性があります) に対する権利を与えるかどうかは明確ではありません。または、アプリケーションをこのライブラリにリンクして、商業的利益のために販売できますか? それとも別の種類のライセンスが必要ですか? Intel サイトでこの質問をする場所が見つかりませんでした (Contact sales のようなものではありません) !

4

4 に答える 4

8

また、ARM が後援するオープン ソース プロジェクトNe10もあり、最初は少数の浮動小数点、ベクトル演算、および行列操作関数をカバーしています。

于 2012-09-11T07:49:05.017 に答える
6

あなたの質問には、あなたの見方に応じて、いくつかの答えがあります。

Intel IPP は、高速フーリエ変換などの一般的なタスクを実行するための多くの事前に調理された関数を含むライブラリです。オープン ソース コミュニティには、同じことを行う特定のライブラリがあります。

などなど。これらのライブラリのすべてが、さまざまな ARM コア向けに最適化されているわけではありません。

あなたの質問に対する 2 番目の角度は、大幅に異なる ARM コアで動作するものが必要な理由です。Cortex A ファミリ プロセッサには、(オプションの!) ARM NEON SIMD 命令があり、(MMX/SSE/AltiVec のように) 一度にデータ セットを取得し、それに複数の操作を適用できます。これにより、大量のデータを処理するために必要な命令の量が削減されます。ARM11xx ファミリには、VFP3 と呼ばれる類似のものがありますが、より制限されています。ARM9xx ファミリには、この種の最適化が本当に欠けています。それとは別に、ARM アーキテクチャには Thumb と Thumb2 があり、コードを小さく高速化できます。

最終的に、多数の ARM コアで実際に実行される最適化されたライブラリは、異なるワークロードに対して同じアルゴリズムを複数実装する必要があります。これにより、ライブラリのサイズが増加します。あなたはその代価を払っても構わないと思っていますか?

于 2012-03-02T13:18:42.977 に答える
4

iOS には、利用可能な場合は SIMD を使用して ARM 用に最適化された加速フレームワークがあります。こちらの Apple のドキュメントを参照してください。

于 2012-09-10T02:13:56.823 に答える