0

L3 などの共有リモート キャッシュへのアクセスに費やされたサイクルを測定する方法。システム全体とスレッドごとの両方で、このキャッシュ アクセス情報を取得する必要があります。特定のツール/ハードウェア要件はありますか? または、任意の式を使用して、時間間隔で費やされたサイクルの概算値を取得できますか

4

1 に答える 1

3

マシンに存在するさまざまなキャッシュに対する平均レイテンシ (単一スレッドが実行されているとき)を取得するには 、Windows 用の RMMA ( http://cpu.rightmark.org/products/rmma.shtml )などのメモリ プロファイラー ツールを使用できます。 Linux 用の lmbench。

これらのツールで使用されるアイデアに基づいて、独自のベンチマークを作成することもできます。この StackOverflow の質問に投稿された回答を参照してください: メモリのレイテンシを測定する か、Lmbench ベンチマークのしくみについては Google を参照してください。

特定のメモリ アクセス パターンの正確なレイテンシを知りたい場合は、シミュレータを使用する必要があります。このようにして、メモリ システムを通過するメモリ アクセスを追跡できます。ただし、シミュレータは、最新のプロセッサまたはメモリ システムに存在するすべての効果をモデル化するわけではありません。

複数のスレッドが L3 への平均レイテンシにどのように影響するかを知りたい場合は、独自のベンチマークを作成するのが最善の策だと思います。

于 2013-03-11T06:59:10.777 に答える