問題タブ [slurm]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
linux - SLURM sbatch スクリプト内で Bash 変数を使用する
別のファイルから値を取得し、これを SLURM 送信スクリプト内で使用しようとしています。ただし、値が非数値であるというエラーが表示されます。つまり、逆参照されていません。
スクリプトは次のとおりです。
これを通常の Bash シェル スクリプトとして実行すると、proc の数が正しく出力され、正しいmpirun
呼び出しが行われます。したがって、awk
コマンドは proc の数を正しく解析し、変数は期待どおりに逆参照されます。
ただし、これを SLURM に送信すると、次のようになります。
エラーが発生します:
誰でもこれを手伝ってもらえますか?
linux - SLURMでジョブが送信された場所を見つける方法は?
SLURM を介して、学校の HPC クラスターにいくつかのジョブを送信しました。シェル スクリプトはすべて同じ名前であるため、ジョブ名はまったく同じように表示されます。のように見えます
ジョブを区別できるように、どのディレクトリからジョブが送信されたかを知るにはどうすればよいですか?
slurm - slurm sbatch がスクリプトを計算ノードにコピーしないようにする
sbatch がスクリプトを計算ノードにコピーするのを止める方法はありますか? たとえば、実行すると:
test.sh は、実行中の計算ノードの /var/lib/slurm-llnl/slurmd/etc/ にコピーされます。これに関する問題は、test.sh が使用する必要がある /shared_between_all_nodes/ に他のスクリプトがあり、パスのハードコーディングを避けたいことです。
sge では、qsub -by を使用して、スクリプトが計算ノードにコピーされないようにすることができました。slurm に同様のオプションまたは構成はありますか?
slurm - Slurm ジョブの合計 CPU 使用率を取得するにはどうすればよいですか?
各ジョブで使用される CPU 時間の合計を取得しようとしています。有望な sacct フィールドをいくつか見つけましたが、どれを使用すればよいですか?
ドキュメント ( https://computing.llnl.gov/linux/slurm/sacct.html ) によると、TotalCPU は SystemCPU と UserCPU の合計を反映していますが、子プロセスは反映していません。しかし、子プロセスを含めた合計が欲しい...
他の候補については、cputimeraw は同じレベルの詳細を提供しません。
私は TotalCPU の代わりに cputimeraw を使用する傾向がありますが、ジョブによって生成された子プロセスを含めた合計であることを確認したいと考えています。ドキュメントは、子プロセスについて何らかの方法で何も示していません。
誰か提案はありますか?
ありがとうございました、
ロバート
stdout - SLURM が出力ファイル (stdout) を更新する頻度を変更するにはどうすればよいですか?
SLURM を使用して、スーパーコンピューターにジョブをディスパッチしています。--output=log.out
コンテンツをジョブの stdout からファイル ( ) に配置するオプションを設定しましたlog.out
。ファイルは 30 ~ 60 分ごとに更新されるため、ジョブのステータスを確認するのが難しくなっています。
このファイルの更新に時間がかかる理由を教えてください。このファイルがより頻繁に更新されるように設定を変更する方法はありますか?
SLURM 14.03.4-2 の使用
slurm - SLURM の -t 10-0 のようなダッシュ付きの時間制限はどういう意味ですか?
さっき見た
ヘルプで見つけた
だから-t
間違いなく時間制限です。でも10-0
10分0秒ですか?それとも10時間0分?それとも何か他のものですか?
cuda - Intel CPU への OpenCL アクセスを制限しますか?
現在、CUDA_VISIBLE_DEVICES 環境変数を使用して、Linux 上の NVIDIA GPU への OpenCL アクセスを制限することができます。Intel CPUデバイスへのOpenCLアクセスを制限する同様の方法を知っている人はいますか? (動機: 私は、計算サーバーのユーザーに、SLURM だけで OpenCL プログラムを実行させようとしています。)
matlab - sbatch で --array と --nodelist を使用する
Matlab がコンピューティング クラスターでリソースを利用する方法には制限があるため、それぞれが特定のノードのすべてのコアを使用するいくつかのジョブを作成したいと考えています。--array オプションを他のパラメーターと組み合わせて使用することで、各ジョブを個別のノードで確実に取得できます。ただし、 -c オプションを使用して特定のノードのコアを最大化しようとしているにもかかわらず、何らかの理由で、クラスターの slurm スケジュールが既に使用されているノードにジョブを配置しています。
--exclusive オプションを使用しても何も変わらないようです。私は単一のタスクでも同じ問題を抱えていました。私の回避策は、使用されていないノードを確認し、 --nodelist オプションを使用して具体的に要求することでした。--array を --nodelist と組み合わせて使用して、リスト内の各ジョブとノードが 1 対 1 で一致するようにする方法はありますか? 現在、SLURM は各ジョブにすべてのノードを使用しようとしています。