1

実行ノードをオフにして slurmctld デーモンを開始する方法はありますが、これらのノードのサスペンドを要求したことを信じさせる方法はありますか (たとえば、SuspendProgramを呼び出した場合など)。

仮想クラスターをセットアップしているので、SuspendProgramResumeProgramは仮想マシンを終了してインスタンス化します。このようにして、私はマスターノードのみの電源を入れることができ、マスターノードは要求された場合にのみノードを起動しました。

問題は、私が slurmctld を開始するとき、ノードが起動し、ノードが終了したことを伝え、ノードがシャットダウンするのを待つ必要があることです。「想定される」すべてのインスタンスの電源をオンにする必要があるため、不要なコストが追加されます。

slurmctld を実行しているマスターをインスタンス化し、ノードがアイドル状態であると彼に思わせたいと思います ~ SuspendProgramの後のように。

乾杯

4

1 に答える 1

1

試すことができるのは、ノードを状態POWER_DOWNに設定slurm.confして、起動時にslurmctldそれらのノードが電源がオフになっていることを確認することです。SuspendProgram

NodeName=... Sockets=... CoresPerSocket... [etc] State=POWER_DOWN 
于 2015-03-24T09:11:27.453 に答える