ワークロード内の DRAM アクセスの数と場所Perf
を検出するために使用しています。場所については、サンプリング モードでトレースする必要があります。したがって、サンプリング モードでトレースし、アクセスの総数を取得するために、アクセスイベントの数にサンプリング周期 (つまり、各サンプル間の命令の数) を掛けます。
また、アプリケーションがCPU 上にある合計時間も必要です。つまり、 によって報告される値と同様の値が必要です。この単一アプリケーションの各 DRAM アクセス間のアイドル期間 (アプリケーションもCPU上にある時間)を知る必要があるためです。これはサンプリング モードでは報告されず、両方のモード (つまり、との両方) を同時に使用することはできません。これを達成するメカニズムはありますか?top
perf record
perf stat