2

中央マネージャーからコマンドcondor_statusを実行すると、ミドルウェアとしてcondorを使用して3台のサーバーを接続し、HPCクラスターを形成します。中央マネージャーでジョブを実行し、SSH経由で他のノードに接続できる他のノードは表示されませんが、中央マネージャーをコンドルホストとして設定し、すべてのユーザーが書き込みと読み取りを行えるようにするコンドル構成ファイルに何かが欠けていること。デーモンMASTER、STARTDをワーカーノードのデーモンリストに保持します。

セントラルマネージャーでcondor_statusを実行すると、セントラルマネージャーが表示され、計算ノードで実行すると、「CEDAR:6001:Failed to connect to」というエラーが表示され、その後にセントラルマネージャーのIPとポート番号が表示されます。

4

3 に答える 3

2

私はなんとかそれを解決することができます。問題は、実行中の中央マネージャーのファイアウォール(私の場合はiptables)にありました。そのため、ファイアウォールを停止すると(su -c "service iptables stop")、すべてのノードが正常に表示され、condor_status"と入力しました。

ファイアウォールのステータスは、「serviceiptablesstatus」を使用して確認できます。

于 2012-02-13T19:55:44.187 に答える
0

ここで起こっている可能性のあることがいくつかあります。このチュートリアルに従って、問題が解決するかどうかを確認することをお勧めします-

http://spinningmatt.wordpress.com/2011/06/12/getting-started-creating-a-multiple-node-condor-pool/

于 2012-02-12T21:47:18.133 に答える
0

私の場合、サービス「condor.exe」はサーバー上で実行されていませんでした。手動で停止しました。私はそれを始めたばかりで、すべてがうまくいきました。

于 2017-01-17T16:53:32.833 に答える