私はVS2005(作業中)を使用しており、次のことを行うSSE組み込み関数が必要です。
16ビット整数で満たされた既存の__m128i
na_1,a_2,....,a_8
があります。
私が今やりたいいくつかの計算は16ビットではなく32を必要とするので、nから16ビット整数の2つの4セットを抽出し、それぞれ__m128i
を含む2つの別々のsに入れたいと思います。a_1,...,a_4
a_5,...,a_8
_mm_set
さまざまな組み込み関数を使用してこれを手動で行うこともできますがmov
、アセンブリで8秒になるため、これを行うためのより高速な方法があることを期待していました。