0

現在、ClusterVisionOS3.1を使用してクラスターに取り組んでいます。クラスターを扱うのはこれが初めてなので、おそらく「明らか」を試したことがないでしょう。

「qsub」コマンドを使用して、単一のジョブをクラスターに送信できます(これは正常に機能しました)

しかし、問題は一度に複数のジョブを送信するときに始まります。それらを一度に送信するスクリプトを作成することもできますが、そうすると、すべてのノードが私のジョブで占有され、ジョブを送信したい人が増えます。

だからここに取引があります:

32ノード(各4プロセッサ/スロット)

最善の方法は、クラスターに3つのノード(12プロセッサー)を使用し、可能であれば、これらのノード/プロセッサーですべてのジョブをキューに入れるように指示することです。ノードにジョブごとに1つのプロセッサを使用させることができれば、それは完璧です。

4

1 に答える 1

0

わかりました。わかったと思いますが、この問題の解決策はありません。私の個人的な解決策は、sshを介してクラスターに接続するスクリプトを作成し、そのスクリプトに、ユーザー名で既に実行されているジョブの数を確認させることです。スクリプトは、その数が同時に20ジョブを超えていないかどうかをチェックします。この数に達しない限り、それは仕事を提出し続けます。

多分それは醜い解決策ですが、実用的な解決策です!

プロセッサに関しては、ジョブはすでにさまざまな単一プロセッサに送信されており、ノードの全範囲を十分に活用しています。

于 2010-03-30T08:45:46.277 に答える