状況
Tesla C1060をGTX 670に切り替えた2 GPUサーバー(Ubuntu 12.04)があります。4.2の上にCUDA 5.0をインストールしました。その後、simpleMPI のすべてのサンプル execpt をエラーなしでコンパイルしました。しかし、実行する./devicequery
と、次のエラーメッセージが表示されます。
foo@bar-serv2:~/NVIDIA_CUDA-5.0_Samples/bin/linux/release$ ./deviceQuery
./deviceQuery Starting...
CUDA Device Query (Runtime API) version (CUDART static linking)
cudaGetDeviceCount returned 38
-> no CUDA-capable device is detected
私が試したこと
これを解決するために、 CUDA対応デバイスで推奨されているすべての考えを試しましたが、役に立ちませんでした:
/dev/nvidia*
そこにあり、権限は666(crw-rw-rw-)で、所有者はroot:rootですfoo@bar-serv2:/dev$ ls -l nvidia* crw-rw-rw- 1 root root 195, 0 Oct 24 18:51 nvidia0 crw-rw-rw- 1 root root 195, 1 Oct 24 18:51 nvidia1 crw-rw-rw- 1 root root 195, 255 Oct 24 18:50 nvidiactl
sudoでコードを実行してみました
CUDA 5.0 は、ドライバーとライブラリーを同時にインストールします
PSここは lspci です | grep -i nvidia:
foo@bar-serv2:/dev$ lspci | grep -i nvidia
03:00.0 VGA compatible controller: NVIDIA Corporation GK104 [GeForce GTX 670] (rev a1)
03:00.1 Audio device: NVIDIA Corporation GK104 HDMI Audio Controller (rev a1)
04:00.0 VGA compatible controller: NVIDIA Corporation G94 [Quadro FX 1800] (rev a1)
[アップデート]
foo@bar-serv2:~/NVIDIA_CUDA-5.0_Samples/bin/linux/release$ nvidia-smi -a
NVIDIA: API mismatch: the NVIDIA kernel module has version 295.59,
but this NVIDIA driver component has version 304.54. Please make
sure that the kernel module and all NVIDIA driver components
have the same version.
Failed to initialize NVML: Unknown Error
CUDA 5.0インストーラーを使用してドライバーとライブラリを同時にインストールすると、どうなるでしょうか。いまだに横たわっている古い 4.2 バージョンが問題を起こす可能性はありますか?