0

サメは私にこれを言いました:

この命令は、16バイトのアドレス境界にアラインされていないループの開始です。最適なパフォーマンスを得るには、コンパイラ指令を使用してホットループの開始を調整する必要があります。gcc 3.3以降では、-falign-loops=16コンパイラフラグを使用します。

for (int i=0; i < 4; i++) { // line with the info
   //...code
}

そのフラグをどのように設定しますか?それは本当にパフォーマンスを向上させますか?

4

1 に答える 1

3

Sharkからのヒントは必ずしも適切ではありません。ほとんどの場合、ループを揃えても大きな違いはありません。コードのボトルネックに焦点を当て、このような非常に小さな調整に頼る前に、アルゴ/コードレベルで何ができるかを確認してください。

于 2010-04-26T13:24:53.417 に答える