GPU アプリケーションの制限を確認するために、GPU アプリケーションからデータを抽出したいと考えています。アプリケーションはリモート サーバー上で実行されるため、 nvprofを使用する必要があるため、 Visual Profilerでローカルにインポートするファイルを作成する必要があります。を使用してファイルを作成しようとしましたnvprof -o file_name <app> <params>
がnvprof --analysis-metrics --output-profile file_name <app> <params>
、Visual Profiler でこれらのファイルをインポートすると、[分析] セクションでいくつかのフィールドが空になります: 「不十分なグローバル メモリ ロード データ」、「不十分なグローバル メモリ ストア データ」、「不十分なカーネル」 SMデータ」……。分析セクションのすべての情報を取得するために、ファイル (またはそれ以上) を生成するにはどうすればよいですか? flagsを指定してnvccでcuda コードをコンパイルします-lineinfo -arch compute_20 -code sm_20 --ptxas-options=-v
。空のフィールドの例を次に示します。
5327 次