問題タブ [pbs]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
pbs - PBS ジョブ スクリプトでウォールタイムを取得する
ジョブ スクリプトを PBS キューイング システムに送信する場合、ウォールタイムは自動的に指定されるか、ユーザーによって指定されます。
問題は、この時間にジョブ スクリプトからアクセスできるかどうかです。このウォールタイムを取得するための環境変数またはその他の方法はありますか。
最後に、ジョブ スクリプトは、キュー システムによってジョブが強制終了されないように、さらに作業を行うための十分な時間が残っているかどうかを時々判断する必要があります。
アップデート:
少なくともユーザーがリソース リストでウォールタイムを指定している場合は、次の回避策を提案できます (bash での作業)。
qstat 出力からウォールタイムを解析し、その値を PBS_WALLTIME 変数に入れます。したがって、コマンド
のようなものが得られます
logging - 複数の場所への PBS スクリプト -o ファイル
PBS クラスターでジョブを実行するとき、ジョブログ (-o ファイル) を 2 か所に置きたいと思うことがあります。1 つは$PBS_O_WORKDIR
すべてをまとめるためのもので、もう 1 つ${HOME}/jobOuts/
は grep/awking/etc...
コマンド ラインからテストを実行すると、次のように動作しtee
ます。
しかし、これを PBS スクリプトに入れようとすると、PBS スクリプトと qsub に入れても機能しません。
ここにqsubとエラーがあります:
以下でいくつか他のことを試しましたが、何も機能しませんでした。
1 行 (カンマ、セミコロン、スペース):
そして2行:
2 つの動作するライナーは 2 番目の -o オプションを使用するだけで、1 つのライナーは機能しません。
助言がありますか?出来ますか?
queue - ジョブが送信された直後に終了ステータスに入る
PBS キューを使用しています。ジョブを送信するとすぐに終了ステータスになるキューがあり、利用可能な出力/エラー ファイルがありません (do.sh.exxxxxxxxx と do.sh.oxxxxxxx はありません)。
Python を使用して一連のジョブを送信すると、ジョブの一部が数秒間 R 状態になり、その後終了状態になります。R 状態に入った人には、出力/エラー ファイルがあります。
エラーファイルが表示されます
tput: No value for $TERM and no -T specified
/var/spool/torque/mom_priv/jobs/9282194.redwood.speech.cs.cmu.edu.SC: Command not found.
他の人が喜んでジョブを送信しているので、キュー自体は問題ないはずですが、ジョブすら送信できません。私が使用するスクリプトは他のマシンでも使用できるので、スクリプトは問題ないと思います。提出できない特定のマシンがある理由がわかりません。
この投稿を読んでくれてありがとう、本当に助けてくれてありがとう。
jobs - Torque PBS Manager の権限ルールは変更できません
そのようにキューを変更しようとすると:
set queue standard total_jobs=16
次のエラーが表示されます。
qmgr obj=standard svr=default: 属性を設定できません、読み取り専用または権限が不十分です total_jobs
コマンドをルートとして発行しています。
python - sh.py が xvfb-run を実行していない
xvfb-run
py.sh 経由で実行しようとしていますがsh.ErrorReturnCode_1
、結果の pdf が作成されていません。
小さなhtmlファイルを作成しました:
次にxvfb_run
、Python で sh.py を介して実行しました。
次に、シェルに戻って、何かが作成されていて、何も作成されていないかどうかを確認します。
したがってxvfb-run
、上記のコマンドをコピーすると、正常に動作します。
そして、私が作成しようとしていたPDFファイルがあります:
call
次に、標準ライブラリのメソッドを試しました:
次に、DISPLAY
環境変数が設定されていないと思いましたが、それにも満足していません。
py.shcall
がそのコマンドを実行できなかった理由は何ですか? 私がここに欠けているものはありますか?
openmpi - ./oceanG を netcdff5.so にリンクできません
私はROMSモデリングに取り組んでいます。LinuxクラスターにOpenmpiをインストールしました。それに応じて LD_LIBRARY_PATH も調整しました。私は今、独特の問題に直面しています。
bash シェルから mpirun -np 4 ./oceanG ocean.in を指定すると、モデルが正常に実行されます。ただし、バッチ ファイルの同じコマンドでは、./oceanG を netcdff5.so にリンクできません。
次のエラーメッセージが表示されます。
./oceanG: 共有ライブラリの読み込み中にエラーが発生しました: libnetcdff.so.5: 共有オブジェクト ファイルを開けません: そのようなファイルまたはディレクトリはありません./oceanG: 共有ライブラリの読み込み中にエラーが発生しました: libnetcdff.so.5: 共有オブジェクト ファイルを開けません: いいえそのようなファイルまたはディレクトリ ./oceanG: 共有ライブラリのロード中にエラーが発生しました: libnetcdff.so.5: 共有オブジェクト ファイルを開けません: そのようなファイルまたはディレクトリはありません ./oceanG: 共有ライブラリのロード中にエラーが発生しました: libnetcdff.so.5: 共有を開けませんobject file: そのようなファイルまたはディレクトリはありません
私のPBSファイル彼は次のように
この奇妙な問題の解決策を探しています
queue - qdel コマンドが「不明なジョブ ID」を返すのはなぜですか
OS バージョン
CentOS リリース 4.6 (最終) カーネル \r on an \m 2.6.9-100.ELsmp
問題
qdel を実行すると、次のエラーが表示されます。
qdel: 不明なジョブ ID 20432.scyld.localdomain
情報
qstat -n の出力
「/var/spool/torque/server_name」の内容
scyld.ローカルドメイン
質問
エラーが発生するのはなぜですか?
matlab - 異なる PBS ジョブ間のランダム シード
複数の PBS ジョブ間で異なる乱数を Matlab で作成しようとしています (ジョブ配列を使用しています)。各 Matlab ジョブは、次のような乱数が生成される並列 parfor ループを使用します。
ただし、結果をプロットすると、さまざまなジョブの結果が完全にランダムではないことがわかります。たとえば、結果は乱数の関数であるため、数値がまったく同じであると言って数値化することはできませんが、間違いはありません。それをプロットするとき。プロセスIDおよび/またはクロックを使用して、各ジョブでランダムシードを初期化しようとしました:
しかし、これで問題は解決しませんでした。また、shuffleSeed (時計ベース) を使用する前に、ジョブごとに異なる秒数で一時停止しようとしました。
以上のことから、parfor が何らかの形でランダム シードをいじっていると思いました。parfor のさまざまな反復で異なる乱数を確実に取得する必要がある場合、それは理にかなっています。
私の質問は、それは本当にそうですか、どうすればそれを解決し、さまざまな PBS ジョブ間でランダム性を得ることができますか?
それぞれが 2 つのワーカーで parfor を使用して 4 つのジョブを実行するEDITでは、各ジョブには独自のシード (parfor の外部に設定) がありますが、生成された数値はジョブ間で同一であることを確認しました (parfor の反復間ではなく、Matlab によって処理されます)。 .
EDIT 2 @Sam Roberts が提案したことを試して、次のコードを使用します。
しかし、上記のスクリプトへのさまざまな呼び出しで同じ番号を取得します。