“nsight”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

946 参照

cuda - リモートサーバー上のTCC対応デバイスでCUDAコードをデバッグする方法は？

間もなく稼働する本番サーバーで、開発用PCからリモートデバッグセッションを開始したいと思います。サーバーで、リモートデスクトップを使用してNSightを起動してから、ローカルマシンでCUDAデバッグを開始しようとします（以前はサーバーをターゲットとして指定しました）。その結果、デバッグセッションが切断され、「リモートシステムはリモートデスクトップからログインしています。WDDMアダプターはデバッグできません」と表示されます。

これは意図された動作、バグ、間違った構成ですか？また、リモートデスクトップを使用するソリューションがない場合、デバッグセッションを開始できるようにNSightモニターを起動するにはどうすればよいですか？

ターゲットサーバーには、2つのTeslaK10とQuadroFX（ディスプレイ用）があります。すべてのTeslaデバイス（実際には4つ）は、TCCがオンになっていることを示しています。

NSight 3.0、CUDA 5.0、およびVisual Studio 2008を使用しています（後者の2つは開発ワークステーションでのみ使用されます）。

最後にもう1つ、アプリケーションをサーバーにコピーしてリモートデスクトップから実行すると正常に機能します。

cuda nsight

2013-01-02T15:11:50.783

0 投票する

1 に答える

4041 参照

nsight - Nsightリモートデバッガー設定

GPUデバッグ専用（CUDAなし）のリモートNsightv2.2デバッガーをセットアップしようとしています。リモートターゲットマシンと開発マシンをセットアップするために、このNvidiapdfに従いました。すべてが稼働していますが、2つの間の通信は適切ではありません。MSVSMON.exeがリモートマシンで実行されていないなどのエラーが発生します。必要な正確な設定がわかりません。何をすべきか、

VS2010プロジェクト設定
Nsight Monitor（リモートマシン）の設定
VS2010および開発マシンのNsight設定。

nsight

2013-01-04T14:30:12.000

0 投票する

1 に答える

608 参照

cuda - nvvp と nsight のプロファイラーでは異なる結果が得られますか?

gst_inst_128bit 命令を試してみたい。同じプログラムで、nvvp は多くの gst_inst_128bit コマンドを実行します。nsight のプロファイラでは、4 回の gst_inst_32bit 命令が取得されます。それらは同じプログラムである必要があります。この状況はどのように発生する可能性がありますか?

実験は、Linux、CUDA 5.0、GTX 580 で試行されました。プログラムは、カーネル関数で 1 つの配列から別の配列にデータをコピーするだけです。

カーネル:

cuda nsight nvvp

2013-01-10T09:27:15.517

0 投票する

3 に答える

3498 参照

linux - NSightプロファイラー信号139

NSightに組み込まれているプロファイラーを使用してプログラムのプロファイリングを試みていますが、プロファイリングセッションは開始直後に終了し、フィードバックとして「警告：アプリケーションがシグナル139を受信しました」を受け取ります。これは何を意味するのでしょうか？

次のエラーメッセージも表示されます。

セッションタイムライン全体を読み取ることができません。表示されるタイムラインは、アプリケーションが終了する前にプロファイルデータのフラッシュを中止または失敗したため、空または不完全である可能性があります。アプリケーションは、終了する前にcudaDeviceReset（）を呼び出して、すべてのプロファイルデータがフラッシュされるようにする必要があります。

linux cuda nvidia nsight

2013-01-16T16:41:40.320

0 投票する

3 に答える

2800 参照

visual-studio-2010 - Visual Studio で cuda ファイルをデバッグする

「mex」編集した cpp 関数 (function.cpp") があります。次に、Visual Studio で function.cpp ファイルを開き、実行中の matlab プロセスに Visual Studio をアタッチします。

matlab で関数を呼び出すと、function.cpp ファイルにブレークポイントを設定して、変数を観察しながらステップ実行できます。

関数を cuda ファイル (function.cu) に変更すると、デバッグプロセスが失敗します。上記のプロセスに従って、まだ function.cu 内で停止できますが、変数が表示されません。変数を「監視」しようとすると、「エラーシンボル..見つかりません」と表示されます

私はビジュアルスタジオにnsightをインストールしました。質問: function.cpp ファイルの場合と同様に、デバッグモードでファイル function.cu の変数を確認するにはどうすればよいですか。これは可能ですか？

function.cu はプロジェクトに含まれていないことに注意してください。関数の cpp コードを含む単なるスタンドアロンファイルです (somefunction(){} など)。デバッグ目的で、ビジュアルスタジオで開いています。「nvmex -g wrapper.cu」を使用して matlab で function.cu ファイルをコンパイルしています。wrapper.cu は、function.cu 内に記述された somefunction() を呼び出す matlab mexfunction ラッパーです。

visual-studio-2010 debugging matlab cuda nsight

2013-01-17T19:51:33.280

0 投票する

2 に答える

1831 参照

eclipse - Nsight Eclipse Editionを使用しているときにgccでコンパイルするにはどうすればよいですか？

私はNvidiaのNsightに小さなプロジェクトを持っており、それが私のためにmakefileを作成します。いくつかのSSE命令を使用したいのですが、プロジェクト内のcppファイルをnvccではなくgccでコンパイルしたいと思います。

それを行うようにNsightを構成する方法はありますか、それともMakefileを手動で作成する必要がありますか？

編集：もちろん、.cuファイルはnvccでコンパイルする必要があります。

eclipse cuda nsight

2013-01-21T17:06:08.037

0 投票する

0 に答える

341 参照

cuda - Nsight デバッガーがデバイス機能に移動しない

私はオプティマス技術を備えたノートブックを持っています。グラフィックカード。そのため、ubuntu 12.10 (64 ビット) に Bumblebee をインストールしました。CUDA 5 をインストールし、「optirun」で実行します。しかし、Nsight (Eclipse) でのデバッグに問題があります。ホストコードをデバッグできますが、デバイスの機能がスキップされます。

関連する投稿をいくつか見ましたが、私の問題はまだ解決されていません。「optirun」で Nsight を実行しようとしました。また、gdb の前に optirun を追加しました。

私を助けてください。

ありがとう

cuda nsight optimus

2013-01-21T20:34:49.947

0 投票する

3 に答える

1817 参照

concurrency - GTX 480 と CUDA 5 でデータ転送と計算をオーバーラップできないのはなぜですか?

カーネルの実行を memcpyasync とオーバーラップさせようとしましたが、うまくいきません。固定メモリ、異なるストリームなどを使用して、プログラミングガイドのすべての推奨事項に従います。カーネルの実行が重複していることがわかりますが、メモリ転送では重複しません。私のカードにはコピーエンジンと実行エンジンが 1 つしかないことはわかっていますが、実行と転送はオーバーラップするはずですよね?

「コピーエンジン」と「実行エンジン」は、関数を呼び出す順序を常に強制しているようです。[HtoD x2、Kernel、DtoH] を実行する 4 つのストリームで作業が行われます。各ストリームで HtoDx2,Kernel,DtoH serie を発行すると、stream2 のようなプロファイラーで、最初の DtoH 操作が終了するまで HtoD の最初の操作が開始されないことがわかります。最初に各ストリームで HtoD を発行し、次に 2 番目の HtoD、次にカーネル、次に DtoH (幅) を発行すると、重複は見られず、発行順序も GPU によって強制されます。

CUDA SDK にある simpleStreams の例を試してみましたが、同じ動作が見られます。

Visual Profiler と Nsight for VS2008 の両方で問題を示すスクリーンキャプチャをいくつか添付します。

ps。CUDA_LAUNCH_BLOCKING 環境を設定していません

シンプルなストリームビジュアルプロファイラー シンプルなストリームビジュアルプロファイラー

MyApp Nsight タイムライン幅優先

MyApp Nsight タイムラインの深さ優先

編集：

追加の x4 カーネル (合計 2HtoD、5 カーネル、ストリームごとに 1DtoH) を配置 --> --concurrent-kernels-off を使用して、または使用せずに nvprof を実行すると、経過時間は同じです。env CUDA_LAUNCH_BLOCKING=1 を設定すると、(コマンドラインから) 7.5% のパフォーマンスの向上が見られます!

システム仕様:

ウィンドウズ7
最初の PCI-E スロットに NVIDIA 6800 VGA
2 番目の PCI-E スロットの GTX480
NVIDIA ドライバー: 306.94
ビジュアルスタジオ 2008
CUDA v5.0
ビジュアルプロファイラー 5.0
Nsight 3.0

concurrency cuda overlapping nsight

2013-01-22T10:20:13.943

0 投票する

2 に答える

2681 参照

cuda - CUDA 5 NSIGHTがコンパイルフラグを設定

Kepler K20 用にプロジェクトをコンパイルするには、-rdc=trueフラグを設定する必要があります。nsight eclipse エディションでこのフラグを設定するにはどうすればよいですか? 私のバージョンはCUDA 5.K20です。nsight eclipse エディション

cuda nsight

2013-01-24T07:44:13.383

0 投票する

2 に答える

421 参照

cuda - Nsightは、リモートでデバッグするときにVS10 Cudaのブレークポイントをスキップ（無視）しますが、ターゲットマシンでローカルにデバッグする場合は正常に機能します

ホスト上でcudaプロジェクトをリモートでデバッグすると、ブレークポイントは無視されますが、完全に実行されます。しかし、ターゲットマシンでプロジェクトをローカルにデバッグすると、正常に動作します。

ドライバーのバージョンを確認したところ、301.42で、nsightのバージョンは2.2です。

ターゲットマシンにはGeforce8600GTがあり、ホストマシンにはGeforce6200turboCacheがあります。ホストマシンのGPUはTCC対応ではないと思います。

nsight Analysisアクティビティはローカルとリモートの両方で正常に機能しますが、cudaデバッグはローカルモードでのみ機能します

cuda gpu nsight cuda-gdb

2013-01-25T15:48:37.353

問題タブ [nsight]

Reference