たとえば、a が [1.0 -1.0 0.0 2.0] で b が [1.0 1.0 1.0 1.0] の場合に a と b を比較する場合、2 つのパックされた float (__m128's) の符号が同じかどうかを示す SSE 組み込み関数を使用してマスクを作成するにはどうすればよいでしょうか。得られる望ましいマスクは [true false true true] です。
1878 次
2 に答える
5
ここに1つの解決策があります:
const __m128i MASK = _mm_set1_epi32(0xffffffff);
__m128 a = _mm_setr_ps(1,-1,0,2);
__m128 b = _mm_setr_ps(1,1,1,1);
__m128 f = _mm_xor_ps(a,b);
__m128i i = _mm_castps_si128(f);
i = _mm_srai_epi32(i,31);
i = _mm_xor_si128(i,MASK);
f = _mm_castsi128_ps(i);
// i = (0xffffffff, 0, 0xffffffff, 0xffffffff)
// f = (0xffffffff, 0, 0xffffffff, 0xffffffff)
このスニペットでは、i
との両方f
が同じビットマスクになります。タイプでそれが必要だと思う__m128
ので、 を追加してf = _mm_castsi128_ps(i);
から に戻しました__m128i
。
このコードはゼロの符号に敏感であることに注意してください。そのため0.0
、-0.0
結果に影響します。
説明:
コードの仕組みは次のとおりです。
f = _mm_xor_ps(a,b); // xor the sign bits (well all the bits actually)
i = _mm_castps_si128(f); // Convert it to an integer. There's no instruction here.
i = _mm_srai_epi32(i,31); // Arithmetic shift that sign bit into all the bits.
i = _mm_xor_si128(i,MASK); // Invert all the bits
f = _mm_castsi128_ps(i); // Convert back. Again, there's no instruction here.
于 2011-12-09T03:53:37.087 に答える
2
_mm_movemask_ps
4つのフロートから最上位ビット(つまり符号ビット)を抽出する命令を見てください。http://msdn.microsoft.com/en-us/library/4490ys29.aspxを参照してください
たとえば、[1.0 -1.0 0.0 2.0]の場合、movemask_psは4、つまりバイナリで0100を返します。したがって、各ベクトルに対してmovemask_psを取得し、結果を比較すると(おそらく、ビット単位でXORではありません)、すべての符号が同じであるかどうかが示されます。
a = [1.0 -1.0 0.0 2.0]
b = [1.0 1.0 1.0 1.0]
movemask_ps a = 4
movemask_ps b = 0
NOT (a XOR b) = 0xB, or binary 1011
したがって、2番目のベクトル要素を除いて、符号は同じです。
于 2011-12-09T04:13:53.537 に答える