より効率的なものとその理由は何ですか?
具体的には_mm_loadu_si128対_mm_load_si128C.
(編集者注: または、これはアセンブリとタグ付けされていました。おそらく、手書きの asm との比較を意味していました。これはmovdqu、特に AVX を使用しないと同じことではありません。ALU 命令のメモリ オペランドにまったく分離せずにコンパイルできるためです。)movdqa_mm_load_si128movdqa
より効率的なものとその理由は何ですか?
具体的には_mm_loadu_si128対_mm_load_si128C.
(編集者注: または、これはアセンブリとタグ付けされていました。おそらく、手書きの asm との比較を意味していました。これはmovdqu、特に AVX を使用しないと同じことではありません。ALU 命令のメモリ オペランドにまったく分離せずにコンパイルできるためです。)movdqa_mm_load_si128movdqa