以前のバージョンの Nvidia プロファイラーを使用して、l1 および l2 キャッシュ ヒット率をプロファイリングしましたが、使用したバージョンがわかりません。cuda 4.2 ビジュアル プロファイラーには、L1 および L2 プロファイリング情報がないようです (グローバル キャッシュ リプレイ オーバーヘッドを除く)。cuda 4.2 (または特定の以前のバージョン) ビジュアル/コマンドライン プロファイラーを使用して、L1 または L2 キャッシュ ヒット率をプロファイリングするにはどうすればよいですか?
1 に答える
Windows と Linux のどちらを使用しているかはわかりませんが、Windows には MS Visual Studio 用の Parallel Nsight があります (Eclipse 用のバージョンもあります)。Nsight では、さまざまな「実験」を定義できます。「カスタム」実験を使用することもできます。「メモリ」実験を選択すると、目的の L1 および L2 キャッシュ ヒット率が含まれます。それを示すスクリーンショットを添付します
これは NSight paralell 3.0 から取得したものですが、以前のバージョンでも使用できます。
編集:
ビジュアル プロファイラー (少なくともバージョン 5.0 ですが、以前のバージョンも同様になると思います) を使用すると、関心のあるイベントとメトリックをセットアップできます。ビジュアル プロファイラー 5.0 では、[実行] --> [メトリックとイベントの構成] をクリックします。添付のウィンドウで、見たいカウンターを設定できます。利用可能なメトリクスとイベントは、基礎となるハードウェア (つまり、GPU が持つアクセス可能なカウンター) によって異なります。GTX 480 の一部のメモリ カウンターの画像を添付
EDITED 2: 元の質問を編集した後、Linuxを求めていることに気づきました... Linuxの場合、NVidiaがそのようなVisual Profilerを提供しているかどうかはわかりません(提供していると思います)。そうでない場合は、Eclipse NSight バージョンに興味があるかもしれません ...