私はUbuntuPreciseを実行し、2つのTeslaC2075とディスプレイデバイスであるQuadro600を搭載したDellPrecisionRackを持っています。最近、デスクトップコンピューターでいくつかのテストを終了し、ワークステーションに移植しようとしました。
CUDAが存在しなかったので、このガイドに従ってインストールし、この提案に従ってSDKMakefileを適合させました。
私が今直面しているのは、単一のサンプル(10個の異なるサンプルのようにテストした)が実行されていないということです。これらは私が得ているエラーです:
[deviceQuery] starting...
./deviceQuery Starting...
CUDA Device Query (Runtime API) version (CUDART static linking)
cudaGetDeviceCount returned 10
-> invalid device ordinal
[deviceQuery] test results...
FAILED
> exiting in 3 seconds: 3...2...1...done!
[MonteCarloMultiGPU] starting...
CUDA error at MonteCarloMultiGPU.cpp:235 code=23510 (cudaErrorInvalidDevice) "cudaGetDeviceCount(&GPU_N)"MonteCarloMultiGPU
==================
Parallelization method = threaded
Problem scaling = weak
Number of GPUs = 0
Total number of options = 0
Number of paths = 262144
main(): generating input data...
main(): starting 0 host threads...
Floating point exception (core dumped)
[reduction] starting...
reduction.cpp(124) : cudaSafeCallNoSync() Runtime API error 10 : invalid device ordinal.
[simplePrintf] starting...
simplePrintf.cu(193) : CUDA Runtime API error 10: invalid device ordinal.
ご覧のとおり、ほとんどのエラーは、エラーコード10を返すcudaGetDeviceCount呼び出しの問題を示しています。マニュアルによると、問題は次のとおりです。
cudaErrorInvalidDevice: This indicates that the device ordinal supplied by the user does not correspond to a valid CUDA device.
残念ながら、私が見つけた唯一の解決策は、デバイスの電源プラグをチェックすることを提案しました。私はそれをしました、そしてそれは何も悪いことではありませんでした。ワークステーションを再起動しても役に立ちません。
構成の詳細をお知らせします。コメントを残してください!