問題タブ [simd]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
7 に答える
4614 参照

optimization - 3D 演算を SSE やその他の SIMD に変換すると、どれくらい高速化しますか?

私は自分のアプリケーションで 3D 数学を広範囲に使用しています。ベクトル/行列ライブラリを SSE、AltiVec、または同様の SIMD コードに変換すると、どの程度の速度向上を達成できますか?

0 投票する
2 に答える
2438 参照

gcc - 組み込み関数を使用するときに GCC に 3 つ以上の SIMD レジスタを使用させるにはどうすればよいですか?

私はいくつかのコードを書いており、SIMD 組み込み関数 SSE2/3 を使用して高速化しようとしています。私のコードは、いくつかのデータを XMM レジスターにロードして何度も操作する必要があるような性質のものです。生成されたアセンブラー コードを見ていると、XMM0 と XMM1 で別のものをリロードするために、GCC がデータをメモリにフラッシュし続けているようです。x86-64 用にコンパイルしているので、15 個のレジスタがあります。GCC が 2 つしか使用していないのはなぜですか? さらに使用するように依頼するにはどうすればよいですか? レジスタに値を「固定」する方法はありますか? 変数定義に "register" キーワードを追加しましたが、生成されたアセンブリ コードは同じです。

0 投票する
2 に答える
37042 参照

gcc - gcc でベクトル化するには?

v4 シリーズのコンパイラーは、AMD Athlon や Intel Pentium/Core チップなどの最新の CPU でSIMDgccプロセッサーを使用してループを自動的にベクトル化できます。これはどのように行われますか?

0 投票する
9 に答える
2106 参照

gcc - gcc 以外にコードをベクトル化できるコンパイラは?

特定のオプションが指定され、適切な条件が与えられた場合、GCC はループを自動的にベクトル化できます。同じことができる広く利用可能な他のコンパイラはありますか?

0 投票する
5 に答える
2210 参照

gcc - 自動ベクトル化の実用化?

gcc が実行できる自動ベクトル化を利用した人はいますか? 現実の世界では (コード例とは対照的に)? 利用するには、既存のコードを再構築する必要がありますか? この方法でベクトル化できる実稼働コードにはかなりの数のケースがありますか?

0 投票する
4 に答える
1291 参照

c - double の配列の SIMD?

SIMD が必要な作業を行っており、double の配列に対して操作を行う必要があります。これをサポートしている主流のアーキテクチャはありますか? 浮動小数点演算しか見たことがありません。

前もってありがとう、ステファン

0 投票する
5 に答える
74615 参照

c++ - GNUC++用のSSESSE2およびSSE3

GNU C ++のSSE、SSE2、SSE3を理解するための簡単なチュートリアルはありますか?SSEでコードの最適化をどのように行うことができますか?

0 投票する
5 に答える
17587 参照

c++ - 優れたポータブル SIMD ライブラリ

ac/c++ API を提供し、Intel および AMD の拡張機能と Visual Studio で動作し、GCC と互換性のある移植可能な SIMD ライブラリを誰でも推奨できますか? double の 512x512 配列のスケーリングなどを高速化しようとしています。ベクトル内積、行列乗算など

これまでのところ、私が見つけたのは http://simdx86.sourceforge.net/だけですが、最初のページにあるように、ビジュアルスタジオではコンパイルされません。

私が収集したものから、AMD で動作しない Intel IPP もあります。AMD の Framewave もありますが、ライブラリのコンパイルとリンクに問題があり、フォーラムは完全に機能していません。どこかで Framewave を使用できた人はいますか?

ありがとう。

0 投票する
1 に答える
1537 参照

iphone - iPhone の SIMD float ユニットを使用した float から integer への変換

現在、DSP 関連のコードを Shark で最適化しようとしていますが、浮動小数点から整数への変換に多くの時間を費やしていることがわかりました。

iPhone には ARM11 FP コプロセッサが搭載されているように見えるので、コードを FTOSI 命令に置き換えることができないかと考えています。ARM Web サイトで入手できるドキュメントがいくつかありますが、手動で最適化されたアセンブリをインライン化した経験はありません。誰かが前にそれをしたことがありますか?
コードをインライン化できると思います

しかし、指示が​​利用可能かどうかを確認するにはどうすればよいですか?
どうすれば自分の値を渡すことができますか?

EDIT1: Louis が既に指摘したように、「Compile for Thumb」をオフにしてコンパイルしていることを忘れていました。

EDIT2: float を unsigned Int ではなく signed Int16 に変換したいので、ARM 命令を FTOUI から FTOSI に変更しました。これは元の投稿の間違いでした。

0 投票する
1 に答える
1011 参照

parallel-processing - OpenCLフレームワークでMIMDを実行することは可能ですか?

間もなく、複数のデータ(MIMD)に対して複数の命令を実行できるnVidiaGTX300が登場します。OpenCLがMIMDを実行できるかどうか疑問に思いますか?