4 つの個別の整数で満たされた 128 ビット変数があります。[1,2,3,4]。右にシフトしたいので、[2,3,4,0] を取得できます。これを行う最速の方法は何ですか。
私の現在のコード:
__m128 v1;
v1 = (__m128)_mm_srli_si128( _mm_castps_si128(v1) , 4 );
これはビットのシフトに成功しますが、速度とキャッシュの最適化 (変数をできるだけ少なくすること) を目指しています。__m128i との間でのキャストを回避するために、このコードを改善する方法はありますか?
ありがとう