サメは私にこれを言いました:
この命令は、16バイトのアドレス境界にアラインされていないループの開始です。最適なパフォーマンスを得るには、コンパイラ指令を使用してホットループの開始を調整する必要があります。gcc 3.3以降では、-falign-loops=16コンパイラフラグを使用します。
for (int i=0; i < 4; i++) { // line with the info
//...code
}
そのフラグをどのように設定しますか?それは本当にパフォーマンスを向上させますか?