PAPI を使用して L2 キャッシュ ミスの数のデータを収集しました。4 つのスレッド (mpirun -np 4) で MPI アプリケーションを実行し、各スレッドが L2 でキャッシュ ミスを読み取ります。各スレッドは、タイムスタンプごとにデータを出力します。例えば:
Timestamp data
xxx530 thread# 0 2136
xxx531 thread# 0 3217
.. . .
. . .
. . .
. . .
xxx550 thread# 0 412334255
xxx530 thread #1 2456
xxx531 thread#1 4243
xxx532 thread #1 4567
and so on
ここで、私の qstn は、スレッド 0、1、2、および 3 のタイムスタンプ xxx530 にすべてのキャッシュ ミス値を追加するか、タイムスタンプ xxx530 の thrreda0,1,2,3 の最大値を取得するかです。