を使用して Power8 プロセッサのメモリ パフォーマンスを評価しているときに、イベントとperfの違いを理解するという問題が発生しました。ほとんどのカウンターは両方のバージョンに存在しますが、oprofile のドキュメントとの説明は同じです。たとえば、次のようになります。PM_DATA_ALL_*PM_DATA_*papi_native_avail
PM_DATA_FROM_LMEM
MMCR1[16] が 1 の場合、デマンド ロードのみ、またはデマンド ロードとプリフェッチにより、プロセッサのデータ キャッシュがローカル チップのメモリからリロードされました。
私はいくつかのデータを測定することによって違いを理解します. 十分な大きさのタスクを提供すると、*_ALLバージョンがより高い値を持つという予想される違いを観察できます。を使用したメジャーでのカウンターの多重化の概念を理解していperfます。
では、実際にこれらのイベントのすべてとは何でしょうか?
