1

私の仕事は、マルチプロセッサ コンピューター (例: 4 コア) の各ノードを を使用して測定することperfです。cache-misses、LLC-loads、LLC-load-misses、LLC-stores、LLC-store-misses などを含め、合計統計データのみを取得します。

それらを区別する方法はありますか?

4

1 に答える 1

0

のバージョンによっては、とスイッチperfを組み合わせて使用​​できます。-a-C

kernel.org の perf wikiから:

デモ マシンには 2 つの CPU しかありませんが、CPU は 1 つに制限できます。

   perf stat -B -e cycles:u,instructions:u -a -C 1 sleep 5

    Performance counter stats for 'sleep 5':

    301,141,166 cycles
    225,595,284 instructions             #      0.749 IPC

    5.002125198  seconds time elapsed

したがって、プロセッサが 4 つある場合は、次のようにすることができます。

perf stat -B -e cycles:u,instructions:u -a -C 0 sleep 5
perf stat -B -e cycles:u,instructions:u -a -C 1 sleep 5
perf stat -B -e cycles:u,instructions:u -a -C 2 sleep 5
perf stat -B -e cycles:u,instructions:u -a -C 3 sleep 5
于 2012-12-12T13:39:24.017 に答える