問題タブ [sse2]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
x86 - SSE2 instruction to typecast an integer register to short register and vice-versa
Is there any SSE2 instruction to typecast an integer register to short register and vice-versa? Please suggest.
c# - Intel/AMD SSE2 アクセラレーションが使用されるように、Salsa 20/12 で C# を使用することは可能ですか?
私は eStream プロジェクトに興味があり、C# を使用して Intel/AMD アクセラレーションでデータ ストリームを暗号化/復号化しています。
C# を使用して Intel/AMD ハードウェアと対話し、次のアルゴリズムを機能させるにはどうすればよいですか?
- サルサ 20/12
- ソーサマウンク
sse2 - 2 つの 32 ビット符号付き整数 SSE2 を使用した乗算
SSE2 命令セットを使用して 2 つの符号付き 32 ビット整数を乗算するにはどうすればよいですか?
c - 8x16 レジスタを、偶数と奇数のインデックス要素を持つ 2 つの 4x32 レジスタに変換する SSE2 命令
8x16 レジスタを 2 つの 4x32 レジスタに変換する SSE2 命令はありますか? 提案してください。
c++ - SSE2 を使用して距離計算をベクトル化する方法
A と B はベクトルまたは長さ N であり、N は 20 から 200 の範囲にある可能性があります。これらのベクトル間の距離の 2 乗、つまり d^2 = ||AB||^2 を計算したいと考えています。
これまでのところ、私は持っています:
コードをプロファイリングしたことと、これがボトルネックであることを除いて、これは問題なく動作しているようです (50% 以上の時間がこれだけに費やされています)。Win 7 で Visual Studio 2012 を使用しています。最適化オプションは次のとおり/O2 /Oi /Ot /Oy-
です。私の理解では、VS2012 はそのループを (SSE2 を使用して) 自動ベクトル化する必要があります。ただし#pragma loop(no_vector)
、コードを挿入しても、顕著な速度低下は見られないため、ループがベクトル化されていないと推測されます。コンパイラは、次のメッセージでそれを確認します。
私の質問は次のとおりです。
- VS2012 がベクトル化できるようにこのコードを修正することは可能ですか?
- そうでない場合、コードを自分でベクトル化することは理にかなっていますか?
- SSE2 コーディングについて学ぶための Web サイトを教えてもらえますか?
- ベクトル化が逆効果になる N の値はありますか?
- とは
reason '1105'
?
c - __m128i レジスタの設定ビット数の高速カウント
__m128i レジスタの設定ビット数をカウントする必要があります。特に、次の方法を使用して、レジスタのビット数をカウントできる 2 つの関数を作成する必要があります。
- レジスタの設定ビットの総数。
- レジスタの各バイトの設定ビット数。
上記の操作を全体的または部分的に実行できる組み込み関数はありますか?
c - n ビットの __m128i をシフトする
変数が__m128i
あり、その 128 ビット値を n ビット、つまり like_mm_srli_si128
と_mm_slli_si128
work にシフトする必要がありますが、バイトではなくビットでシフトする必要があります。これを行う最も効率的な方法は何ですか?