問題タブ [sse2]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

262 問題

0 投票する

1 に答える

1144 参照

x86 - SSE2 instruction to typecast an integer register to short register and vice-versa

Is there any SSE2 instruction to typecast an integer register to short register and vice-versa? Please suggest.

2013-05-16T10:58:00.787

0 投票する

0 に答える

64 参照

c# - Intel/AMD SSE2 アクセラレーションが使用されるように、Salsa 20/12 で C# を使用することは可能ですか?

私は eStream プロジェクトに興味があり、C# を使用して Intel/AMD アクセラレーションでデータストリームを暗号化/復号化しています。

C# を使用して Intel/AMD ハードウェアと対話し、次のアルゴリズムを機能させるにはどうすればよいですか?

サルサ 20/12
ソーサマウンク

c#encryption stream cryptography sse2

2013-05-16T14:46:04.757

0 投票する

1 に答える

389 参照

sse2 - 2 つの 32 ビット符号付き整数 SSE2 を使用した乗算

SSE2 命令セットを使用して 2 つの符号付き 32 ビット整数を乗算するにはどうすればよいですか?

sse2

2013-05-16T17:46:01.573

0 投票する

2 に答える

485 参照

c - 8x16 レジスタを、偶数と奇数のインデックス要素を持つ 2 つの 4x32 レジスタに変換する SSE2 命令

8x16 レジスタを 2 つの 4x32 レジスタに変換する SSE2 命令はありますか? 提案してください。

c x86 intrinsics sse2

2013-05-24T10:20:19.920

0 投票する

2 に答える

1662 参照

c++ - SSE2 を使用して距離計算をベクトル化する方法

A と B はベクトルまたは長さ N であり、N は 20 から 200 の範囲にある可能性があります。これらのベクトル間の距離の 2 乗、つまり d^2 = ||AB||^2 を計算したいと考えています。

これまでのところ、私は持っています:

コードをプロファイリングしたことと、これがボトルネックであることを除いて、これは問題なく動作しているようです (50% 以上の時間がこれだけに費やされています)。Win 7 で Visual Studio 2012 を使用しています。最適化オプションは次のとおり/O2 /Oi /Ot /Oy-です。私の理解では、VS2012 はそのループを (SSE2 を使用して) 自動ベクトル化する必要があります。ただし#pragma loop(no_vector)、コードを挿入しても、顕著な速度低下は見られないため、ループがベクトル化されていないと推測されます。コンパイラは、次のメッセージでそれを確認します。

私の質問は次のとおりです。

VS2012 がベクトル化できるようにこのコードを修正することは可能ですか?
そうでない場合、コードを自分でベクトル化することは理にかなっていますか?
SSE2 コーディングについて学ぶための Web サイトを教えてもらえますか?
ベクトル化が逆効果になる N の値はありますか?
とはreason '1105'?

c++visual-c++optimization vectorization sse2

2013-06-08T14:25:28.483

0 投票する

4 に答える

9724 参照

c - __m128i レジスタの設定ビット数の高速カウント

__m128i レジスタの設定ビット数をカウントする必要があります。特に、次の方法を使用して、レジスタのビット数をカウントできる 2 つの関数を作成する必要があります。

レジスタの設定ビットの総数。
レジスタの各バイトの設定ビット数。

上記の操作を全体的または部分的に実行できる組み込み関数はありますか?

c sse simd sse2 hammingweight

2013-06-27T23:37:41.183

0 投票する

1 に答える

3858 参照

c - n ビットの __m128i をシフトする

変数が__m128iあり、その 128 ビット値を n ビット、つまり like_mm_srli_si128と_mm_slli_si128work にシフトする必要がありますが、バイトではなくビットでシフトする必要があります。これを行う最も効率的な方法は何ですか?

c x86 sse simd sse2

2013-07-12T08:29:53.783

1 2 3 4 5 6 7 8 9 10

問題タブ [sse2]

Reference