これは関数のプロトタイプです:
v4si __builtin_ia32_shufps (v4si, v4si, int)
一部のWebサイトでは、intフィールドに16進数しかなく、上位ビットと下位ビットが分離されているように見えましたが、必要なのは論理的な32ビットシフトです。
X3 X2 X1 X0 shifted by 32 bits to get X2 X1 X0 0
2つのv4siベクトルを使用した別の例:
X7 X6 X5 X4 | X3 X2 X1 X0, where each X is a 32 bit and what I want for a shift is the
same a logical shift, but with each vector element. So:
X7 X6 X5 X4 | X3 X2 X1 X0 << 2 = X5 X4 X3 X2 | X1 X0 0 0
shufpsはこれを行うための正しいコマンドですか?