CUDA 4.2 で Tesla 2075 (cc 2.0) を使用しています。非ディスプレイGPU (Tesla)でプログラムを実行していますが、次のエラーが表示されます。
"the launch timed out and was terminated "
このエラーは非表示 GPU で予想されますか?
また、ウォッチドッグ タイマーを無効にするにはどうすればよいですか?
CUDA 4.2 で Tesla 2075 (cc 2.0) を使用しています。非ディスプレイGPU (Tesla)でプログラムを実行していますが、次のエラーが表示されます。
"the launch timed out and was terminated "
このエラーは非表示 GPU で予想されますか?
また、ウォッチドッグ タイマーを無効にするにはどうすればよいですか?
Windowsで実行していると仮定します。その場合は、Tesla 2075 をTCC モードにします。これによりコンピューティング アクセスが許可され、Windows はディスプレイ デバイスのようにそれを管理しなくなり、ウォッチドッグ タイマーがなくなります。nvidia-smi が見つからない場合は、Windows で nvidia-smi.exe を検索してください。(ディスプレイ ドライバーと一緒にインストールされているはずです。)次に、C2075 がシステム内の唯一の CUDA GPU である場合、コマンドは次のよう になります。ツールのコマンド ライン ヘルプを取得nvidia-smi -g 0 -dm 1
することもできます。nvidia-smi --help
これを変更した後、カードを TCC モードにするために、おそらくシステムの再起動が必要になります。
一方、このマシンで Linux と X-windows を実行している場合、解決策は少し異なります。1 つの方法は、たとえばランレベルを 3 に設定して再起動するなど、単純に X を無効にすることですが、これを行う方法は他にもあります。ただし、他の GPU で X GUI を失うことになります (これは非表示 GPU であると言ったので、別の GPU があると思います)。X と GUI を他の GPU に保持するには、xorg.conf ファイルを変更して X をディスプレイ GPU に強制し、コンピューティング (Tesla) GPU から切り離す必要があります。これを行う方法はさまざまですが、2 つの NVIDIA GPU (1 つはディスプレイ用) がある場合、xorg.conf ファイルの関連する「Display」セクションの BusID パラメータを使用して、X ディスプレイを 1 つの GPU に強制する必要があります。さらに、他の「表示」セクションはすべて削除する必要があります。例えば:
BusID “PCI:34:0:0”
GPU の PCI ID は、lspci
コマンドまたはコマンドから決定できますnvidia-smi –a
。
また、NVIDIA ドライバーのREADME ファイルのX 構成オプションの付録も参照してください。