-O フラグを使用してコンパイラ (私の場合は gcc) によって行われる最適化に関する非常に基本的な質問があります。ここでは、ループのベクトル化のみに焦点を当てたいと思います。ポインターのエイリアシング/競合状態の危険のない単純な for ループを想定します。-O0 フラグを使用してコンパイラーによって生成されたコードが、ループがコンパイラーによってベクトル化された場合と同じくらい高速になるように、このループを書き直すことは可能ですか?
質問する
103 次