0

cuda-gdbを使用して、sshを介してリモートクラスターでコードをデバッグしようとしています。ノードには6つのTeslaC2070GPUがあります。

$ deviceQuery | grep "^Device"
Device 0: "Tesla C2070"
Device 1: "Tesla C2070"
Device 2: "Tesla C2070"
Device 3: "Tesla C2070"
Device 4: "Tesla C2070"
Device 5: "Tesla C2070"

しかし、cuda-gdbでコードを実行すると、エラーコード= 24が表示されます。「致命的:すべてのCUDAデバイスは表示に使用され、デバッグ中は使用できません。」

私はすでに設定-gencode arch=compute_20,code=sm_20し、うまくコンパイルしました。info cuda devicesデバッガーに入力すると、吐き出されNo CUDA devicesます。エクスポートも試しCUDA_VISIBLE_DEVICES="0,2"ましたが、まだ機能しません。私は何をすべきか?私はcuda5.0を使用しています。前もって感謝します。

4

1 に答える 1

1

「lsof/dev / nvidia*」を実行してみてください。デバイスノードを開いたままにしているプログラムが表示されます。XがこれらのGPUを使用している場合は、出力から明らかです。

于 2013-04-01T17:22:17.860 に答える