9

先週から、CUDA 開発のセットアップで大きな問題が発生しました。モニターも接続した統合 GPU と、CUDA カーネルを実行するための追加の NVIDIA カードがあります。ただし、次のように表示されているため、コードをデバッグできません。

fatal:  All CUDA devices are used for display and cannot be used while debugging. (error code = CUDBG_ERROR_ALL_DEVICES_WATCHDOGGED(0x18)

別の仮想コンソール (CTRL+ALT+F1) に切り替えると、cuda-gdb を使用してコードを実行できるため、X サーバーが NVIDIA GPU をブロックしているようです。NVIDIA カードにモニター ケーブルが接続されていません...

「lsof /dev/nvidia*」は何も出力しません。Xubuntu 14.04 を使用しています。

この問題を解決する方法を知っている人はいますか?

4

2 に答える 2

15

少なくとも SM35 のコンピューティング機能を備えたデバイスでは、環境変数を設定することでこれを回避できるようです。

CUDA_DEBUGGER_SOFTWARE_PREEMPTION=1

cuda-gdb ドキュメント ページで確認できます: http://docs.nvidia.com/cuda/cuda-gdb/#axzz4BrMP ​​oaoW

ではテストです。Maxwell Quadro GPU で実行しています。

nvidia-smi
Fri Jun 17 10:59:47 2016       
+------------------------------------------------------+                       
| NVIDIA-SMI 352.63     Driver Version: 352.63         |                       
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  Quadro M4000M       Off  | 0000:01:00.0      On |                  N/A |
| N/A   37C    P8     9W / 100W |    158MiB /  4087MiB |      1%      Default |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID  Type  Process name                               Usage      |
|=============================================================================|
|    0      2981    G   /usr/bin/X                                      57MiB |
|    0      9186    G   ...ves-passed-by-fd --v8-snapshot-passed-by-    85MiB |
+-----------------------------------------------------------------------------+

アプリケーションをビルドして実行する

 nvcc -g -G foo.cu
 cuda-gdb ./a.out 

...
[Thread debugging using libthread_db enabled]
Using host libthread_db library "/lib/x86_64-linux-gnu/libthread_db.so.1".
fatal:  All CUDA devices are used for display and cannot be used while debugging. (error code = CUDBG_ERROR_ALL_DEVICES_WATCHDOGGED(0x18)

次に、環境変数を設定します。

export CUDA_DEBUGGER_SOFTWARE_PREEMPTION=1
cuda-gdb ./a.out
(cuda-gdb) r
...
warning: Cuda API error detected: cudaMemcpy returned (0xb)

warning: Cuda API error detected: cudaFree returned (0x11)

[Thread 0x7fffed3ff700 (LWP 10302) exited]
[Thread 0x7ffff7fc6780 (LWP 10293) exited]
于 2016-06-17T18:00:38.720 に答える
1

私にとっては、ブロックを変更するのに役立ちました

Section "ServerLayout"
  Identifier "layout"
  Screen 0 "intel"
EndSection

「nvidia」から「intel」への識別子。

于 2016-02-17T10:19:40.497 に答える