2

4 つの個別の整数で満たされた 128 ビット変数があります。[1,2,3,4]。右にシフトしたいので、[2,3,4,0] を取得できます。これを行う最速の方法は何ですか。

私の現在のコード:

__m128 v1;
v1 = (__m128)_mm_srli_si128(  _mm_castps_si128(v1) , 4 );

これはビットのシフトに成功しますが、速度とキャッシュの最適化 (変数をできるだけ少なくすること) を目指しています。__m128i との間でのキャストを回避するために、このコードを改善する方法はありますか?

ありがとう

4

1 に答える 1