コンパイラーの最適化によって改善される可能性のあるコード (関数) をライブラリーで見つけました (主なアイデアとして - コンパイラーに深く入り込むための良いものを見つけるため)。そして、この関数の実行時間の計測をスクリプトで自動化したい。ライブラリの低レベル関数であり、引数を取得するため、これを抽出するのは困難です。したがって、ライブラリ/アプリケーション/環境を変更せずに、この関数 (正確な CPU 時間) を正確に測定する方法を見つけたいと考えています。それを達成する方法はありますか?
ラッパーを作成することもできますが、近い将来、パフォーマンス テスト用にさらに多くのアプリケーションが必要になるため、すべてのアプリケーションに対してラッパーを作成するのは非常に見苦しいと思います。
PS: 私のコードは、ある種の「Performance Monitor Control」レジスタを持つ ARM (armv7el) アーキテクチャで実行されます。Linuxカーネルの「perf」について学びました。しかし、それが私に必要なものかどうかわかりませんか?