1

以前のバージョンの Nvidia プロファイラーを使用して、l1 および l2 キャッシュ ヒット率をプロファイリングしましたが、使用したバージョンがわかりません。cuda 4.2 ビジュアル プロファイラーには、L1 および L2 プロファイリング情報がないようです (グローバル キャッシュ リプレイ オーバーヘッドを除く)。cuda 4.2 (または特定の以前のバージョン) ビジュアル/コマンドライン プロファイラーを使用して、L1 または L2 キャッシュ ヒット率をプロファイリングするにはどうすればよいですか?

4

1 に答える 1

1

Windows と Linux のどちらを使用しているかはわかりませんが、Windows には MS Visual Studio 用の Parallel Nsight があります (Eclipse 用のバージョンもあります)。Nsight では、さまざまな「実験」を定義できます。「カスタム」実験を使用することもできます。「メモリ」実験を選択すると、目的の L1 および L2 キャッシュ ヒット率が含まれます。それを示すスクリーンショットを添付します並列 Nsight パフォーマンスのスクリーンショット

これは NSight paralell 3.0 から取得したものですが、以前のバージョンでも使用できます。

編集:

ビジュアル プロファイラー (少なくともバージョン 5.0 ですが、以前のバージョンも同様になると思います) を使用すると、関心のあるイベントとメトリックをセットアップできます。ビジュアル プロファイラー 5.0 では、[実行] --> [メトリックとイベントの構成] をクリックします。添付のウィンドウで、見たいカウンターを設定できます。利用可能なメトリクスとイベントは、基礎となるハードウェア (つまり、GPU が持つアクセス可能なカウンター) によって異なります。GTX 480 の一部のメモリ カウンターの画像を添付 キャッシュ イベント GTX 480 ビジュアル プロファイラー 5.0

EDITED 2: 元の質問を編集した後、Linuxを求めていることに気づきました... Linuxの場合、NVidiaがそのようなVisual Profilerを提供しているかどうかはわかりません(提供していると思います)。そうでない場合は、Eclipse NSight バージョンに興味があるかもしれません ...

于 2013-03-19T08:12:51.020 に答える