私はAVXプログラミングリファレンスを見ています。新しいHaswellの指示には、待望の「収集」ロードが含まれています。ただし、インデックス付けされたデータ項目の配置制限が何であるかを理解できません。リファレンスのセクション2.5「メモリアライメント」は、VGATHER*
表2.4または2.5のいずれかにさまざまな命令をリストする必要があるようです...しかし、そうではありません。
背景:収集命令でサポートされているデータサイズは4バイトと8バイトですが、私のアプリケーションは、隣接する16ビットデータ値のペアを収集してDWORDSにロードすることでメリットが得られる可能性があります。2バイトスケールの奇数インデックスは2バイトに整列された4バイトのロードを生成し、これが失敗するか、そうでなければ意図したとおりに機能しないかはマニュアルからは明らかではありません(私はすべてを考えると運が悪いと思いますアラインされていないアクセスをサポートする命令には、「U」が含まれているようです)。