より効率的なものとその理由は何ですか?
具体的には_mm_loadu_si128
対_mm_load_si128
C.
(編集者注: または、これはアセンブリとタグ付けされていました。おそらく、手書きの asm との比較を意味していました。これはmovdqu
、特に AVX を使用しないと同じことではありません。ALU 命令のメモリ オペランドにまったく分離せずにコンパイルできるためです。)movdqa
_mm_load_si128
movdqa
より効率的なものとその理由は何ですか?
具体的には_mm_loadu_si128
対_mm_load_si128
C.
(編集者注: または、これはアセンブリとタグ付けされていました。おそらく、手書きの asm との比較を意味していました。これはmovdqu
、特に AVX を使用しないと同じことではありません。ALU 命令のメモリ オペランドにまったく分離せずにコンパイルできるためです。)movdqa
_mm_load_si128
movdqa