6

2 人のユーザーが同時に CUDA プログラムを実行しようとすると、カードまたはドライバーのいずれか (または両方?) がロックされる傾向があることに気付きました。通常の動作を復元するには、カードをリセットするか、マシンを再起動する必要があります。

GPU をロックして、実行中に他のプログラムが干渉できないようにする方法はありますか?

編集

OSはサーバー上で動作するUbuntu 11.10です。X Windows が実行されていない間、カードはテキスト システム コンソールを表示するために使用されます。複数のユーザーがいます。

4

2 に答える 2

7

Linux または Windows で TCC ドライバーを実行している場合は、nvidia-smiユーティリティを使用して GPU を計算専用モードにすることができます。

Compute 排他モードでは、別のプロセスがその GPU でコンテキストを既に保持している場合、ドライバーはコンテキスト確立要求を拒否します。使用中のコンピューティング専用 GPU で実行しようとするプロセスは、使用可能なデバイスがないというエラーを受け取り、失敗します。

于 2012-12-16T11:24:44.937 に答える
2

Task Spoolerなどを使用して、プログラムをキューに入れ、一度に 1 つずつ実行できます。

TORQUE Resource Managerを使用していますが、より構成が難しいですts。TORQUE を使用すると、複数のキュー (つまり、cuda ジョブ用に 1 つ、cpu ジョブ用に 2 つ) を作成し、各 GPU に異なるジョブを割り当てることができます。

于 2012-12-16T10:35:19.137 に答える