c++ - C/C++ アプリケーションでメモリアクセスに費やされた時間をプロファイリングする方法は?

Question

アプリケーション内の関数が費やした合計時間は、次の 2 つの要素に大きく分けることができます。

実際の計算に費やされた時間 (Tcomp)
メモリアクセスに費やされた時間 (Tmem)

通常、プロファイラーは、関数が費やした合計時間の見積もりを提供します。上記の 2 つのコンポーネント (Tcomp と Tmem) に関して費やされた時間を見積もることは可能ですか?

score 7 · Accepted Answer

算術強度の概念は、ルーフラインモデルによって提案されています: https://crd.lbl.gov/departments/computer-science/PAR/research/roofline/。簡単に言えば、メモリアクセスごとに実行される算術命令の数を定義します。

演算強度の計算は、通常、パフォーマンスカウンターを使用して実装されます。

score 6 · Accepted Answer

現在のプロセッサアーキテクチャでは、計算がメモリアクセスとオーバーラップするため、これを測定することはできません (測定しても意味がありません)。また、メモリへのアクセスは、通常、より多くのステップに分割されます (メモリへのアクセス、さまざまなキャッシュレベルへのプリフェッチ、プロセッサレジスタへの実際の読み取り)。

perf とそのハードウェアカウンター (ハードウェアでサポートされている場合) を使用して、さまざまなキャッシュレベルでキャッシュヒットとキャッシュミスを測定し、ハードウェアでのアルゴリズムの効率を見積もることができます。

c++ - C/C++ アプリケーションでメモリ アクセスに費やされた時間をプロファイリングする方法は?

4 に答える 4

Related

Reference

c++ - C/C++ アプリケーションでメモリアクセスに費やされた時間をプロファイリングする方法は?