私は自分のコードをプロファイリングしていますが、すでにその中で最も高価な部分を見つけました。ただし、インライン関数で発生します。影響を測定するために、関数をインライン化しないように強制しました。
次に、正確なプロファイリングデータを報告したいと思います。インラインがないと、大きなオーバーヘッドが発生します(関数は基本的に単一のループですが、非常に頻繁に呼び出されます)。
関数を強制的にインライン化せずに、コードの特定のセクションをそれ自体が関数(makros CALLGRIND_START_INSTRUMENTATION、CALLGRIND_STOP_INSTRUMENTATIONなど)として処理するようにvalgrindに指示できるかどうか疑問に思います。