問題タブ [condor]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
106 参照

distributed-computing - HTCondor ジョブ送信タグ

HTCondor プールでさまざまなジョブのバッチを実行したいと考えています。Type1 の 10 ジョブ、Type2 の 20 ジョブなどとしましょう。これらの各ジョブ タイプは、現在のジョブが終了したときに新しいジョブを取得する必要があります。

タイプが 1 つだけの場合、すべてのジョブが終了したか、ジョブ バッチ全体の制限時間が経過したかを単純にクエリします。これらの要件のいずれかが満たされると、x ジョブの次の反復がクラスターに送信されます。

これは、小さな関数 (Lua で書かれていますが、質問にとってはあまり重要ではありません) によって行われます。

Type1、Type2、Type3のジョブを分けて個別にチェックする可能性はありますか? 現在、現在のユーザーとしてすべてのジョブをチェックしています。

ジョブにタグまたは何かを追加するのが理想的です。チェックアップ コールを変更するだけでよいからです。ドキュメントでは、簡単に追加できるものを見つけることができませんでした.JobIDを覚えていましたが、それらを保存する必要があり、複雑さが増しました.

0 投票する
2 に答える
430 参照

condor - HTCondor ジョブのいずれかがゼロ以外のエラー コードで返されたかどうかをテストするにはどうすればよいですか?

condor_submit25 個のジョブのバッチに対してスクリプトを実行してcondor_wait、それらすべてを完了させてから、condor_submit別のバッチ pf 25 ジョブに対して別のスクリプトを実行しています。

Normal termination (return value 127)最初の 25 個のジョブが(ゼロ以外の戻り値で)失敗したことを確認したい。

どうすればこれを簡単に行うことができますか? または、それが不可能な場合は、ゼロ以外を返す場合に失敗するスクリプトでジョブ実行可能ファイルをラップすることもできますが、HTCondor ジョブを失敗させる方法がわかりません!