を使用して Power8 プロセッサのメモリ パフォーマンスを評価しているときに、イベントとperf
の違いを理解するという問題が発生しました。ほとんどのカウンターは両方のバージョンに存在しますが、oprofile のドキュメントとの説明は同じです。たとえば、次のようになります。PM_DATA_ALL_*
PM_DATA_*
papi_native_avail
PM_DATA_FROM_LMEM
MMCR1[16] が 1 の場合、デマンド ロードのみ、またはデマンド ロードとプリフェッチにより、プロセッサのデータ キャッシュがローカル チップのメモリからリロードされました。
私はいくつかのデータを測定することによって違いを理解します. 十分な大きさのタスクを提供すると、*_ALL
バージョンがより高い値を持つという予想される違いを観察できます。を使用したメジャーでのカウンターの多重化の概念を理解していperf
ます。
では、実際にこれらのイベントのすべてとは何でしょうか?