debugging - メモリ転送とアクセスを検出して可視化するツール

Question

疎行列の LU 分解を計算する C コードに問題があります。そこで、さまざまな最適化を行った別のルーチンを作成します。行列の非ゼロ要素の構造に応じて、一部の実装は非常に高速になりますが、次の例の行列では遅すぎます。ここで、アプリケーションのプロファイルを作成し、コードがメモリからの新しいデータを待機する場所やキャッシュの使用方法を示すツールが必要です。私はすでに valgrind(cachegrind/callgrind) を試しましたが、オーバーヘッドが大きすぎて、異なる実装のランタイム間の比率が完全に変わりました。

メモリトラフィックや同様の問題を分析するための他の OpenSource ツール (Linux、BSD) はありますか? カーネルモジュールを使用しないでください。

score 0 · Accepted Answer

0

メモリプロファイラーで試すことができます

于 2012-06-21T13:39:21.887 に答える

debugging - メモリ転送とアクセスを検出して可視化するツール

1 に答える 1

Related

Reference