クラスタジョブスケジューラに関連する問題を解決しようとしています。
問題は次のとおりです。クラスターで実行される一連のPythonスクリプトがあります。起動プロセスは現在、人間の対話によって実行されています。つまり、クラスターと対話して要求するbashスクリプトがあるテストを開始します。実行に必要なリソース。私たちがやろうとしているのは、自動起動プロセスを構築することです(これは、ジョブステータスを認識し、それに基づいてジョブの終了を待機し、実行を再開するなどの意味で健全である必要があります)。基本的に、ユーザーワークステーションとクラスターの間にレイヤーを実装する必要があります。
もう1つの問題は、さまざまなクラスタージョブスケジューラーと対話するために、レイヤーが十分に賢くなければならないことです。各クラスタースケジューラの詳細を処理することなく、クラスターと対話するのに役立つツールまたはフレームワークが存在するかどうか疑問に思います。Webで検索しましたが、ニーズに合ったものは見つかりませんでした。
ちなみに私たちが使っているプログラミング言語はPythonです。
前もって感謝します!
Br.-