問題タブ [condor]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
hpc - コンドル中央マネージャーは他のコンピューティングノードを見ることができませんでした
中央マネージャーからコマンドcondor_statusを実行すると、ミドルウェアとしてcondorを使用して3台のサーバーを接続し、HPCクラスターを形成します。中央マネージャーでジョブを実行し、SSH経由で他のノードに接続できる他のノードは表示されませんが、中央マネージャーをコンドルホストとして設定し、すべてのユーザーが書き込みと読み取りを行えるようにするコンドル構成ファイルに何かが欠けていること。デーモンMASTER、STARTDをワーカーノードのデーモンリストに保持します。
セントラルマネージャーでcondor_statusを実行すると、セントラルマネージャーが表示され、計算ノードで実行すると、「CEDAR:6001:Failed to connect to」というエラーが表示され、その後にセントラルマネージャーのIPとポート番号が表示されます。
linux - セントラルマネージャー以外のコンドルの実行ノードにジョブを送信できませんでした
4台の専用マシンで構成されるコンドルプールがあります。1台は中央マネージャー、送信、実行ノードとして設定され、他の3台は実行ノードとして設定されています。すべてのマシンのOSとしてCentOS5.4を使用しました。私の問題は、セントラルマネージャーからジョブを送信したときに、セントラルマネージャーでのみ機能するため、JDLファイルで、セントラルマネージャー以外の任意のマシンでジョブを実行するように指定すると、ジョブは保留されて実行されないことです。condor_statusと入力すると、すべてのノードが表示されます。実行中のノードのデーモンリストにデーモンMASTER、STARTDを保持します。誰かがこの問題に遭遇しますか?
benchmarking - LINPACKを使用してコンドルHPCクラスターのベンチマークを行うにはどうすればよいですか?
condorをクラスターミドルウェアとして使用するHPCクラスターがあり、OSはすべてのマシンにCentOSであり、MPICH2をインストールしました。システムをベンチマークして最大Gflopsを取得するにはどうすればよいですか?linpackとatlasライブラリをインストールしましたが、condorでの使用方法に関する情報が見つかりませんでした。
python - 「numpy」がインストールされているクラスター上のマシンにのみジョブをディスパッチするように Condor に指示するにはどうすればよいですか?
Condorを使用して、クラスター上のマシンで処理するジョブを送信する方法を見つけました。多くのマシンがあり、それらのマシンのそれぞれが同じように構成されているわけではないので、私は疑問に思っていました:
私のスクリプトはこのパッケージに依存しているため、numpy がインストールされているマシンに私のジョブ (python スクリプト) をディスパッチするようにコンドルに指示することはできますか?
condor - アイドル ジョブの Condor タイムアウト
コンドル クラスターでジョブを実行していますが、一部のジョブはアイドル状態でハングアップし、終了どころか、まったく開始されないように見えます。手動で実行するcondor_wait -wait n logfile
以外にcondor_rm
、ハングしたジョブを終了するためのより適切な (そして自動的に組み込まれている) 方法はありますか?
逆に、これらのジョブはダグマンにあるため、後のジョブを実行できるように、ダグマンでジョブをタイムアウトにする方法はありますか?
python - ローカルディレクトリからnumpyを使用する
Pythonのパスにディレクトリを追加せずにローカルディレクトリからnumpyを使用する方法はありますか?numpyがインストールされていないマシンのcondorでジョブを実行しているので質問しています。これらのマシンに直接numpyを追加する方法はなく、これらのマシンのパスを変更できるとは思いません。「numpy」がインストールされているクラスター上のマシンにのみジョブをディスパッチするようにCondorに指示する方法を見てきました。マシンにnumpyがあるかどうかを判断することに関して、可能であればすべてのマシンで実行したいのですが、とにかくマシンのclassIdを変更できるかどうかはわかりません。
c# - 未処理の例外:System.Runtime.InteropServices.COMException(0x80080005):
私はmswordを開くc#コードを実行しましたが、正しく実行されます。このプログラムをコンドル環境で実行したいのですが、エラーが発生しました。
このエラーはMSVisualStudio C#に属すると思います。
c++ - コンドル出力ファイルの更新
コンドルを使用していくつかのシミュレーションを実行しており、コンソールに進行状況を出力するようにプログラムをコーディングしました。これはループの最後で行われ、現在の時刻が単純に出力されます (これはパーセンテージまたは経過時間でもあります)。コードは次のようになります。
正常に実行している場合 (つまり、ターミナル/cmd/bash で)、これは正常に動作しますが、コンドル ノードは状態に見えませんprintf()
。シミュレーションが終了すると、すべてのステータス更新がファイルに出力されますが、それ以降は使用できなくなります。コンドルに送信する *.sub ファイルは次のようになります。
サブミットされると、プログラムが実行され (これは で確認されcondor_q
ます)、出力ファイルには次のものが含まれます。
プログラムが対応する出力ファイルの実行を終了すると、次のように表示されます (例):
プログラムの実行中、出力ファイルにはSTART
テキストのみが含まれます。そのため、プログラムを実行しているノードがビジー状態の場合、ファイルは更新されないという結論に達しました。私の質問は、出力ファイルを手動で更新する方法や、プログラムの進行状況に関する情報をより良い方法で収集する方法はありますか?
もうありがとう
マックス
c++ - libssh を使用したカスタム コマンド
condor_submit
コンドル サーバーとの通信に SSH を使用していますが、カスタム コントロール用のコマンド ( 、condor_make
、condor_q
など)を呼び出す必要があります。Xcode プロジェクト (はい、Mac OS を使用しています) に libSSH をダウンロードして正常に統合したところ、提供された関数がカスタム コマンドをサポートしていないことがわかりました。チュートリアルでは、これによりホスト上でコマンドが実行されると述べられています。
しかし、"ls -l"
を let's sayに置き換えると"condor_q"
、コマンドが実行されないようです。次のようなインタラクティブなシェルセッションを使用して、これを修正できました。
私の質問は、コマンドを「偽送信」するよりも、SSH 経由でカスタムコマンドを送信する簡単な方法はありますか?
ありがとう
マックス
directed-acyclic-graphs - CondorDAGファイル-多くの子供を持つ親。子供の親を1行ではなく複数行で表示することは合法ですか?
これが私が持っているものの簡単なツリーです:
AとBは親プロセスであり、CはAとBが終了した後にのみ実行できます。通常、DAGファイルは次のようになります。
次のこともうまくいくかどうか誰かが知っているかどうか疑問に思いました:
Condor DAGのドキュメントを調べましたが、あまり役に立ちません。
ありがとう!