cuda - 起動がタイムアウトになり、終了しました

Question

CUDA 4.2 で Tesla 2075 (cc 2.0) を使用しています。非ディスプレイGPU (Tesla)でプログラムを実行していますが、次のエラーが表示されます。

"the launch timed out and was terminated "

このエラーは非表示 GPU で予想されますか?

また、ウォッチドッグタイマーを無効にするにはどうすればよいですか?

score 4 · Accepted Answer

Windowsで実行していると仮定します。その場合は、Tesla 2075 をTCC モードにします。これによりコンピューティングアクセスが許可され、Windows はディスプレイデバイスのようにそれを管理しなくなり、ウォッチドッグタイマーがなくなります。nvidia-smi が見つからない場合は、Windows で nvidia-smi.exe を検索してください。(ディスプレイドライバーと一緒にインストールされているはずです。)次に、C2075 がシステム内の唯一の CUDA GPU である場合、コマンドは次のようになります。ツールのコマンドラインヘルプを取得nvidia-smi -g 0 -dm 1 することもできます。nvidia-smi --helpこれを変更した後、カードを TCC モードにするために、おそらくシステムの再起動が必要になります。

一方、このマシンで Linux と X-windows を実行している場合、解決策は少し異なります。1 つの方法は、たとえばランレベルを 3 に設定して再起動するなど、単純に X を無効にすることですが、これを行う方法は他にもあります。ただし、他の GPU で X GUI を失うことになります (これは非表示 GPU であると言ったので、別の GPU があると思います)。X と GUI を他の GPU に保持するには、xorg.conf ファイルを変更して X をディスプレイ GPU に強制し、コンピューティング (Tesla) GPU から切り離す必要があります。これを行う方法はさまざまですが、2 つの NVIDIA GPU (1 つはディスプレイ用) がある場合、xorg.conf ファイルの関連する「Display」セクションの BusID パラメータを使用して、X ディスプレイを 1 つの GPU に強制する必要があります。さらに、他の「表示」セクションはすべて削除する必要があります。例えば：

 BusID “PCI:34:0:0”

GPU の PCI ID は、lspciコマンドまたはコマンドから決定できますnvidia-smi –a。

また、NVIDIA ドライバーのREADME ファイルの X 構成オプションの付録も参照してください。

cuda - 起動がタイムアウトになり、終了しました

1 に答える 1

Related

Reference