1

私のサーバーには 4 つの Tesla C2075 があるので、SDK に付属のサンプルの simpleMultiGPU をテストしました。予期せず、セグメンテーション違反が発生しました。cuda-gdb を使用すると、cudaStreamCreate が 2 回目に呼び出されたときにこの障害が発生することがわかりました。deviceQuery の出力は次のとおりです。

$ deviceQuery

CUDA Driver = CUDART,

CUDA Driver Version = 4.2, 

CUDA Runtime Version = 4.2, 

NumDevs = 4, 

Device = Tesla C2075,

Device = Tesla C2075

ドライバーのバージョンは問題ないのに、なぜ 2 番目の cudaStreamCreate が機能しないのか。誰でも私を助けることができますか?

4

1 に答える 1

1

https://developer.nvidia.com/tesla-deployment-kit (TDK の一部)からダウンロードできる nvidia-healthmon を実行することから始めます。

また、の出力nvidia-bug-report.shは常に非常に役立ちます。また、log from nvidia-healthmon( --log-fileflag) から手がかりが得られる場合があります。

失敗している他のアプリケーションはありますか? vectorAddまたはのような SDK から他のアプリを実行して、他の可能性を排除することをお勧めしますmatrixMul

于 2013-01-01T21:38:52.070 に答える