0

4台の専用マシンで構成されるコンドルプールがあります。1台は中央マネージャー、送信、実行ノードとして設定され、他の3台は実行ノードとして設定されています。すべてのマシンのOSとしてCentOS5.4を使用しました。私の問題は、セントラルマネージャーからジョブを送信したときに、セントラルマネージャーでのみ機能するため、JDLファイルで、セントラルマネージャー以外の任意のマシンでジョブを実行するように指定すると、ジョブは保留されて実行されないことです。condor_statusと入力すると、すべてのノードが表示されます。実行中のノードのデーモンリストにデーモンMASTER、STARTDを保持します。誰かがこの問題に遭遇しますか?

4

1 に答える 1

0

あなたの質問に答えるのに十分な情報はありませんが、最初にすべきことは、実行condor_q -analyze <jobid>して、それがあなたに何を伝えているかを確認することです。コンドルのマニュアルセクション2.6.5を参照してください:なぜジョブが実行されないのですか?

考えられる原因の1つは、入出力ファイルを転送するようにCondorに指示しておらず、ノードの「ファイルシステムドメイン」が異なるため、Condorが送信ホストと共通のファイルシステムを共有するホストを見つけることができないことです。

于 2012-03-30T02:31:04.620 に答える