CPU プロファイリングにGoogle の perftools ( http://google-perftools.googlecode.com/svn/trunk/doc/cpuprofile.html ) を使用しています。これは、CPU 時間を大幅に削減するのに役立つ素晴らしいツールです。私のアプリケーションの改善。
残念ながら、コードがまだ少し遅いという点に到達しました。g++ の -O3 最適化レベルを使用してコンパイルすると、特定の関数が遅いということしかわかりませんが、どの側面が遅いかはわかりません。
-O3 フラグを削除すると、プログラムの最適化されていない部分がこの関数を追い越してしまい、遅い関数の実際の部分があまり明確になりません。-O3 フラグをそのままにしておくと、関数の遅い部分がインライン化され、関数のどの部分が遅いかを判断できなくなります。
助言がありますか?ご協力いただきありがとうございます!