5

次のコマンドを使用してプロファイル情報を取得するには、nvprofを使用してプログラムを実行しています。

nvprof -o profileOutput -s ./exe args

ワープの発散、合体した読み取り/書き込み、占有率などに関する情報が必要でした。しかし、ファイルprofileOutputを開くと、他の形式で、@ ^ @^....のような奇妙な記号が表示されます。

私はvimでファイルを開いています。CUDAプログラムのプロファイル情報を表示する正しい方法は何ですか。助けてください。

4

2 に答える 2

5

出力ファイルは Nvidia Visual Profiler (通常は CUDA SDK に含まれています) で開くことができます。

人間が読めるファイルを生成する可能性がもう 1 つあります。--log-file human-readable-output.logオプションを指定できますnvprof(もちろんhuman-readable-output.log出力ファイル名です)。
ログ出力のその他のnvprofオプションを 有効にすることができます。

  • --print-gpu-traceGPU トレース用。
  • --eventsイベントの収集 (例: ブランチ、発射されたワープの数など);
  • --metricsnvprof --query-metrics一部のカスタム メトリック (共有負荷トランザクション、ドラム使用率など -コマンド ラインに入力して表示できるメトリックの完全なリスト) の場合。

NVIDIA nvprof documentationで見つけることができるオプションの完全なリスト。

于 2015-03-04T09:53:40.547 に答える
5

-sそれ自体がデフォルトの状況であるため、必要ありません。

-o後でインポートしたり、Nvidia ビジュアル プロファイラーで開いたりできる出力ファイルを指定します。これは、人間が判読することはできません。

占有率を計算する必要がある場合は、Nvidia が提供するこの占有率計算機を使用できます。それについての記事があります。

ブランチをトレースする必要がある場合は、トレース モードでプロファイリングを使用し、ブランチをトレースできます。

于 2014-07-31T20:05:29.497 に答える