私の仕事は、マルチプロセッサ コンピューター (例: 4 コア) の各ノードを を使用して測定することperf
です。cache-misses、LLC-loads、LLC-load-misses、LLC-stores、LLC-store-misses などを含め、合計統計データのみを取得します。
それらを区別する方法はありますか?
私の仕事は、マルチプロセッサ コンピューター (例: 4 コア) の各ノードを を使用して測定することperf
です。cache-misses、LLC-loads、LLC-load-misses、LLC-stores、LLC-store-misses などを含め、合計統計データのみを取得します。
それらを区別する方法はありますか?
のバージョンによっては、とスイッチperf
を組み合わせて使用できます。-a
-C
デモ マシンには 2 つの CPU しかありませんが、CPU は 1 つに制限できます。
perf stat -B -e cycles:u,instructions:u -a -C 1 sleep 5 Performance counter stats for 'sleep 5': 301,141,166 cycles 225,595,284 instructions # 0.749 IPC 5.002125198 seconds time elapsed
したがって、プロセッサが 4 つある場合は、次のようにすることができます。
perf stat -B -e cycles:u,instructions:u -a -C 0 sleep 5
perf stat -B -e cycles:u,instructions:u -a -C 1 sleep 5
perf stat -B -e cycles:u,instructions:u -a -C 2 sleep 5
perf stat -B -e cycles:u,instructions:u -a -C 3 sleep 5