cuda - CUDA SDKの例は、マルチGPUシステムでさまざまなエラーをスローします

Question

私はUbuntuPreciseを実行し、2つのTeslaC2075とディスプレイデバイスであるQuadro600を搭載したDellPrecisionRackを持っています。最近、デスクトップコンピューターでいくつかのテストを終了し、ワークステーションに移植しようとしました。

CUDAが存在しなかったので、このガイドに従ってインストールし、この提案に従ってSDKMakefileを適合させました。

私が今直面しているのは、単一のサンプル（10個の異なるサンプルのようにテストした）が実行されていないということです。これらは私が得ているエラーです：

[deviceQuery] starting...

./deviceQuery Starting...

 CUDA Device Query (Runtime API) version (CUDART static linking)

cudaGetDeviceCount returned 10
-> invalid device ordinal
[deviceQuery] test results...
FAILED

> exiting in 3 seconds: 3...2...1...done!

[MonteCarloMultiGPU] starting...

CUDA error at MonteCarloMultiGPU.cpp:235 code=23510 (cudaErrorInvalidDevice) "cudaGetDeviceCount(&GPU_N)"MonteCarloMultiGPU
==================
Parallelization method  = threaded
Problem scaling         = weak
Number of GPUs          = 0
Total number of options = 0
Number of paths         = 262144
main(): generating input data...
main(): starting 0 host threads...
Floating point exception (core dumped)

[reduction] starting...

reduction.cpp(124) : cudaSafeCallNoSync() Runtime API error 10 : invalid device ordinal.

[simplePrintf] starting...

simplePrintf.cu(193) : CUDA Runtime API error 10: invalid device ordinal.

ご覧のとおり、ほとんどのエラーは、エラーコード10を返すcudaGetDeviceCount呼び出しの問題を示しています。マニュアルによると、問題は次のとおりです。

cudaErrorInvalidDevice: This indicates that the device ordinal supplied by the user does not correspond to a valid CUDA device.

残念ながら、私が見つけた唯一の解決策は、デバイスの電源プラグをチェックすることを提案しました。私はそれをしました、そしてそれは何も悪いことではありませんでした。ワークステーションを再起動しても役に立ちません。

構成の詳細をお知らせします。コメントを残してください！

score 2 · Accepted Answer

私の最初の質問へのコメントのおかげで、私は解決策を見つけることができました。このガイドに従って、正しく設定する方法を学びました（スクリプトrc.localを忘れないでください）。chmod

cuda - CUDA SDKの例は、マルチGPUシステムでさまざまなエラーをスローします

1 に答える 1

Related

Reference