私は現在、自作の言語用に、自作のコンパイラから出力されたコードを最適化しようとしています。
Intel VTune を試して、ボトルネックがどこにあるかを確認しました: http://www.imada.sdu.dk/~sorenh07/misc/vtune-assembly-optimization.png
「subl」命令が、30 ~ 90 秒間実行されるプログラムのクロックティックの 38% 以上を占めていることは非常に印象的です。誰でも理由を説明できますか?
VTune の「最適化レポート」機能は、icc でコンパイルされていないプログラムには存在しないようです。アセンブラコードの最適化を提案するプログラムはありますか? (つまり、高級言語からのコードではありません)。