問題タブ [sse2]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
1144 参照

x86 - SSE2 instruction to typecast an integer register to short register and vice-versa

Is there any SSE2 instruction to typecast an integer register to short register and vice-versa? Please suggest.

0 投票する
0 に答える
64 参照

c# - Intel/AMD SSE2 アクセラレーションが使用されるように、Salsa 20/12 で C# を使用することは可能ですか?

私は eStream プロジェクトに興味があり、C# を使用して Intel/AMD アクセラレーションでデータ ストリームを暗号化/復号化しています。

C# を使用して Intel/AMD ハードウェアと対話し、次のアルゴリズムを機能させるにはどうすればよいですか?

  • サルサ 20/12
  • ソーサマウンク
0 投票する
1 に答える
389 参照

sse2 - 2 つの 32 ビット符号付き整数 SSE2 を使用した乗算

SSE2 命令セットを使用して 2 つの符号付き 32 ビット整数を乗算するにはどうすればよいですか?

0 投票する
2 に答える
485 参照

c - 8x16 レジスタを、偶数と奇数のインデックス要素を持つ 2 つの 4x32 レジスタに変換する SSE2 命令

8x16 レジスタを 2 つの 4x32 レジスタに変換する SSE2 命令はありますか? 提案してください。

0 投票する
2 に答える
1662 参照

c++ - SSE2 を使用して距離計算をベクトル化する方法

A と B はベクトルまたは長さ N であり、N は 20 から 200 の範囲にある可能性があります。これらのベクトル間の距離の 2 乗、つまり d^2 = ||AB||^2 を計算したいと考えています。

これまでのところ、私は持っています:

コードをプロファイリングしたことと、これがボトルネックであることを除いて、これは問題なく動作しているようです (50% 以上の時間がこれだけに費やされています)。Win 7 で Visual Studio 2012 を使用しています。最適化オプションは次のとおり/O2 /Oi /Ot /Oy-です。私の理解では、VS2012 はそのループを (SSE2 を使用して) 自動ベクトル化する必要があります。ただし#pragma loop(no_vector)、コードを挿入しても、顕著な速度低下は見られないため、ループがベクトル化されていないと推測されます。コンパイラは、次のメッセージでそれを確認します。

私の質問は次のとおりです。

  1. VS2012 がベクトル化できるようにこのコードを修正することは可能ですか?
  2. そうでない場合、コードを自分でベクトル化することは理にかなっていますか?
  3. SSE2 コーディングについて学ぶための Web サイトを教えてもらえますか?
  4. ベクトル化が逆効果になる N の値はありますか?
  5. とはreason '1105'?
0 投票する
4 に答える
9724 参照

c - __m128i レジスタの設定ビット数の高速カウント

__m128i レジスタの設定ビット数をカウントする必要があります。特に、次の方法を使用して、レジスタのビット数をカウントできる 2 つの関数を作成する必要があります。

  1. レジスタの設定ビットの総数。
  2. レジスタの各バイトの設定ビット数。

上記の操作を全体的または部分的に実行できる組み込み関数はありますか?

0 投票する
1 に答える
3858 参照

c - n ビットの __m128i をシフトする

変数が__m128iあり、その 128 ビット値を n ビット、つまり like_mm_srli_si128_mm_slli_si128work にシフトする必要がありますが、バイトではなくビットでシフトする必要があります。これを行う最も効率的な方法は何ですか?