3

私は現在、自作の言語用に、自作のコンパイラから出力されたコードを最適化しようとしています。

Intel VTune を試して、ボトルネックがどこにあるかを確認しました: http://www.imada.sdu.dk/~sorenh07/misc/vtune-assembly-optimization.png

「subl」命令が、30 ~ 90 秒間実行されるプログラムのクロックティックの 38% 以上を占めていることは非常に印象的です。誰でも理由を説明できますか?

VTune の「最適化レポート」機能は、icc でコンパイルされていないプログラムには存在しないようです。アセンブラコードの最適化を提案するプログラムはありますか? (つまり、高級言語からのコードではありません)。

4

1 に答える 1

2

私の推測では、実際に 38% を占めているのは idivl 命令だと思います...除算に時間がかかる方が、減算よりも少し意味がありますか?

于 2010-05-01T15:07:06.157 に答える