Nehalam/westmere Intel マイクロ アーキテクチャ CPU に取り組んでいます。このアーキテクチャ用にコードを最適化したいと考えています。コードの実行時のパフォーマンスを向上させるのに役立つ、GCC による特殊なコンパイル フラグまたは C 関数はありますか?
私はすでに -o3 を使用しています。
Language of the Code - C
Platform - Linux
GCC Version - 4.4.6 20110731 (Red Hat 4.4.6-3) (GCC)
私のコードでは、いくつかの浮動小数点比較があり、100 万回以上行われています。
コードはすでに最適化されていると想定してください。