C++ / VistualStudio / WindowsXP で記述されたソフトウェアを使用したマルチコア (8+) アーキテクチャでパフォーマンスの問題に直面しています。
突然、L1 および L2 キャッシュと CPU->to->Memory 帯域幅のパフォーマンスがまったくわからないことに気付きました。
いくつかのツール (VTune、Glowcode などを含む) をテストしましたが、マルチコア アーキテクチャで負荷テストを行うと、すべてのツールが失敗します (これこそが、ツールが必要な理由です!)。
グラフを作成するのにそれほど派手ではないが、キャッシュ/メモリのパフォーマンスを少なくともいくつか示したり、アプリケーションを手動で計測するためのコードのスニペットを提案したりできる他のツールを提案できますか?
ありがとう!