問題タブ [sbatch]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
555 参照

shell - sbatch+srun: 大量のシングル スレッド ジョブ

フレンドリーな皆さん、こんにちは。

私の質問はかなり具体的です。

1 週間以上にわたって、sbatch と srun を使用した科学実験のために、何千ものシングル スレッド ジョブを送信しようとしています。

問題は、これらのジョブが完了するまでに異なる時間がかかる場合があり、一部のジョブはメモリ制限を超えたために中止されることさえあることです。どちらの動作も問題なく、私の評価はそれに対応しています。

しかし、ジョブが送信されたにもかかわらず、一部のジョブが開始されないという問題に直面しています。

私のスバッチ スクリプトは次のようになります。

現在、エラーログに次のメッセージが表示されています。

1) 「ステップの作成を一時的に無効にする」とはどういう意味ですか? すべての CPU がビジーで、ジョブが省略されているか、または後でリソースが解放されたときにジョブが再開されますか?

2) 一部のジョブが実行されないのはなぜですか?どうすれば修正できますか? srun に正しいパラメーターを使用していますか?

ご協力いただきありがとうございます!

0 投票する
0 に答える
60 参照

multithreading - srun を使用するときに一部のソフトウェアですべての CPU のみを使用してスラームしますか?

次のように定義されたスクリプトがあります。

次に、ジョブを送信しますsbatch job.sh

問題は、program1 は 16 個のコア/CPU をすべて使用しますが、program2 は 1 つしか使用しません (どちらもおそらくマルチスレッドです)。ただし、スクリプトを次のように変更すると:

次に、program2 も 16 コアすべてを使用します。その「srun」を追加する必要があるのはなぜですか?

追加情報として、program2 マルチスレッドの実装は次を使用して行われます。std::async