SSE を利用するために、(C/C++ コードで) インライン アセンブラを実装しようとしています。値を (XMM レジスターまたはメモリから) 別の XMM レジスターにコピーおよび複製したいと考えています。たとえば、メモリに値 {1, 2, 3, 4} があるとします。これらの値をコピーして、xmm1 に {1, 1, 1, 1}、xmm2 に {2, 2, 2, 2} などを入力するようにします。
Intel のリファレンス マニュアルを調べたところ、これを行うための説明が見つかりませんでした。繰り返される MOVSS とローテーションの組み合わせを (PSHUFD 経由で) 使用する必要がありますか?