perf
Intel Xeon E5 ファミリ用のパフォーマンス カウンタ (linux) を使用しようとしています。
キャッシュミスの解釈についてはかなり混乱しています。L1 と LLC の値は簡単にアクセスできますが、L2 の情報は -rNNN イベントを介してレジスタから読み取る必要がありました。しかし、ドキュメンテーションでは、イベント番号とマスク フィールドを組み合わせて NNN 値を与える方法を見つけられませんでした。の 1 つの例だけperf help
が、値 A8 と 01 のマスクを示し、結果として 1a8 になります。しかし、マスキングするときの一般的なルールは何ですか? ドキュメントに書かれるべきではないか、それとも標準のOR関数か何かですか?
また、ドキュメントや他の関連トピックの回答から、Xeon の場合に測定された LLC 値が L3 であるか L2 であるかを理解していません。ハードウェアに第 3 レベルのキャッシュがあるとどうなりますか? LLC はまだ最後のレベル、つまり L3 イベントを測定しますか?
クリアした人いる?