今日、Linux のperfユーティリティを試してみましたが、結果の解釈に問題があります。私は valgrind の callgrind に慣れていますが、これはもちろん、サンプリング ベースの perf メソッドとはまったく異なるアプローチです。
私がしたこと:
perf record -g -p $(pidof someapp)
perf report -g -n
今、私はこのようなものを見ます:
+ 16.92% kdevelop libsqlite3.so.0.8.6 [.] 0x3fe57 ↑ + 10.61% kdevelop libQtGui.so.4.7.3 [.] 0x81e344 ▮ + 7.09% kdevelop libc-2.14.so [.] 0x85804 ▒ + 4.96% kdevelop libQtGui.so.4.7.3 [.] 0x265b69 ▒ + 3.50% kdevelop libQtCore.so.4.7.3 [.] 0x18608d ▒ + 2.68% kdevelop libc-2.14.so [.] memcpy ▒ + 1.15% kdevelop [kernel.kallsyms] [k] copy_user_generic_string ▒ + 0.90% kdevelop libQtGui.so.4.7.3 [.] QTransform::translate(double, double) ▒ + 0.88% kdevelop libc-2.14.so [.] __libc_malloc ▒ + 0.85% kdevelop libc-2.14.so [.] memcpy ...
これらの関数は遅いかもしれませんが、どこから呼び出されているかを知るにはどうすればよいでしょうか? これらのホットスポットはすべて外部ライブラリにあるため、コードを最適化する方法がわかりません。
基本的に、累積コストで注釈が付けられたある種のコールグラフを探しています。ここで、関数は、呼び出したライブラリ関数よりも包括的なサンプリング コストが高くなります。
これはperfで可能ですか?もしそうなら - どのように?
注:「E」はコールグラフをアンラップし、より多くの情報を提供することがわかりました。しかし、コールグラフは多くの場合、十分に深くないか、どこでどれだけの情報が費やされたかに関する情報を提供せずにランダムに終了します。例:
- 10.26% kate libkatepartinterfaces.so.4.6.0 [.] Kate::TextLoader::readLine(int&... Kate::TextLoader::readLine(int&, int&) Kate::TextBuffer::load(QString const&, bool&, bool&) KateBuffer::openFile(QString const&) KateDocument::openFile() 0x7fe37a81121c
64ビットで実行していることが問題になる可能性はありますか? http://lists.fedoraproject.org/pipermail/devel/2010-November/144952.htmlも参照してください(私は fedora を使用していませんが、すべての 64 ビット システムに適用されるようです)。