問題タブ [pbs]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
519 参照

apache - Ubuntu + PBS + アパッチ? 実行中のジョブのリストを Web サイトとして表示するにはどうすればよいですか?

PBS キューのステータス情報を表示するプラグイン/パッケージはありますか? 現在、PBS クラスターのログイン ノードで Apache Web サーバーを実行しています。ステータス情報を表示し、それをゼロから作成せずに最小限のクエリを実行できるようにしたいと考えています (または古い Python スクリプト、ala jobmonarch を変更します)。 承認済み/報奨金付きのソリューションは、Ubuntu で動作する必要があることに注意してください。

更新:以下に示すように、ganglia に加えて、Rocks Cluster Toolkitも調べましたが、Ubuntu に固執したいと思っています。そのため、それを反映するように質問を更新しました。

更新 2: PBSWebとMyPBSも調べましたが、どちらも私のニーズに合っているようには見えません。1 つ目は現在のシステムでは時代遅れであり、2 つ目はコストの見積もりとプロジェクトの予算編成に重点が置かれています。どちらも素晴らしいですが、リソースの可用性、ジョブの完了、および一般的なステータスの更新に関心があります。 8 月 15 日からは、おそらくゼロから独自のものを作成するつもりです。

0 投票する
2 に答える
1861 参照

matlab - ラップトップ/デスクトップを接続してMATLABコンピューティングクラスターを形成しますか?

リモートクラスターで並列ジョブを実行した経験があり、単一のローカルマシンで並列(parfor)ジョブを実行した経験がありますが、独自のクラスターを作成しようとしたことはありません。私はいくつかのラップトップ/デスクトップ/サーバーにアクセスでき(1台のサーバーを除くすべてでrootアクセス)、それらすべて(または一部)を接続してローカルクラスターを形成できるかどうか疑問に思っていました(合計で約30コアになります)。

0 投票する
2 に答える
4290 参照

pbs - PBSバッチシステムはノード間で複数のシリアルジョブを移動しますか?

多くのシリアルプログラムを「並行して」実行する必要がある場合(問題は単純ですが時間がかかるため、同じプログラムに対して多くの異なるデータセットを読み込む必要があるため)、1つのノードのみを使用すれば解決策は簡単です。私がしているのは、各コマンドの後に、たとえばジョブスクリプトで、アンパサンドを使用してシリアルジョブを送信し続けることだけです。

これにより、各シリアルプログラムが異なるプロセッサで自然に実行されます。これは、ログインサーバーまたはスタンドアロンワークステーションでうまく機能します。もちろん、1つのノードのみを要求するバッチジョブでも機能します。

しかし、110の異なるデータセットを読み取るために同じプログラムの110の異なるインスタンスを実行する必要がある場合はどうなりますか?110 ./program#コマンドを送信するスクリプトを使用して複数のノード(たとえば14)に送信すると、バッチシステムは各ジョブを異なるノードの異なるプロセッサで実行しますか、それともすべて同じで実行しようとしますか? 8コアノード?

単純なMPIコードを使用してさまざまなデータを読み取ろうとしましたが、さまざまなエラーが発生し、110個のプロセスのうち約100個が成功し、他のプロセスがクラッシュしました。ジョブ配列も検討しましたが、システムがそれをサポートしているかどうかはわかりません。

シリアルプログラムを個々のデータセットで広範囲にテストしました。ランタイムエラーはなく、各ノードで使用可能なメモリを超えることはありません。

0 投票する
5 に答える
32531 参照

queue - 使用可能なトルク pbs キューの完全なリストを見つけるにはどうすればよいですか?

Q: 「一般的な」Torque MPI システムで使用可能な PBS キューを見つけるにはどうすればよいですか? (管理者に依頼するのに 24 時間以上かかり、システムは定期的な移行で変更されます)

(たとえば、「Std8」は可能なキューの 1 つです)

#PBS -q Std8

0 投票する
1 に答える
674 参照

execution-time - PBSスクリプト(シリアルジョブ)のジョブ実行時間

Portable Batch System(PBS)を使用して行われたシリアルジョブの実行時間を把握しようとしています。その情報は出力ファイル (task.o*) の Epilogue セクションの Resources にありますか? ですかwalltime

0 投票する
1 に答える
231 参照

fortran - トルクでプログラムを実行する

私は、コンパイルしてから、スーパーコンピューターで pbs ジョブとして実行するために送信した fortran のコードを持っています。既に実行中のプログラムを保持したまま、ソースコードを変更して再度コンパイルしたい。私の質問は、別の実行可能ファイルで pbs ジョブを実行している場合に、ソース コードを変更して新しい実行可能ファイルを作成するとどうなるかということです。元の実行可能ファイルの結果は変更されますか?

ありがとう。

0 投票する
1 に答える
633 参照

bash - トルクのjob_state値のリスト

Torqueのjob_stateに可能な値は何ですか?

関連するマニュアルページを調べましたが、完全なリストはまだ見つかりません。

0 投票する
2 に答える
28338 参照

pbs - 現在実行中のPBSジョブのウォールタイムを変更する方法はありますか

私は仕事にかかる時間を過小評価していました。実行中にジョブの制限時間を変更することはできますか?

0 投票する
1 に答える
1220 参照

python - PBS を使用して送信された外部 MPI プログラムを呼び出す並列 Python スレッドの実行

私は python にかなり慣れていないので、分散クラスターにマルチスレッド/マルチプロセス コードを実装する最良の方法がわかりません。

PBS キューイング システムを使用して大規模なクラスターで実行されている外部 MPI プログラムを呼び出すラッパー スクリプトを Python を使用して作成しようとしています。私が取り組んできたタイプのスクリプトの (非常に) 単純化されたバージョンを以下に示します。ここでは、コードが特定のディレクトリに移動し、外部 MPI プログラムを実行し、結果をチェックして大きな変更があったかどうかを確認します。

これは、次を使用してキューに送信されます。

私がやりたいことはsearch_loop、リストから読み取った異なるディレクトリ (たとえば、異なる開始位置を含む) で関数の複数のバージョンを並行して実行することです。プロセスは、呼び出されるたびに MPI 計算の実行に数分かかるため、非常に IO 負荷が高くなります。

threadingモジュールはこの目的に適していますか、それともモジュールmultiprocessingの方が適していますか? おそらくevent、上記の例のブール値のような単純なメッセージをスレッド/プロセス間で渡す必要があります。

また、Python スクリプトが、MPI 実行に割り当てたプロセッサを使用していないことを確認するにはどうすればよいですか?

0 投票する
2 に答える
442 参照

debugging - トルクで2つのキューを設定しますか?

トルク設定に「バッチ」と呼ばれるキューが 1 つあります。ジョブのデバッグ用に「db」という新しいキューを作成したいと考えています。「db」キューには、最大 CPU 時間が 10 分間など、いくつかの制限があります。原則として、両方のキューが同じノードを使用します。コマンド「qmgr」で新しいキューを作成できますが、問題はありません。

私の質問は、両方のキューが同じノードを使用している場合、何か問題はありますか? 異なるキューからの 2 つのプロセス間で干渉が発生する可能性があるかどうかはわかりません。通常、スーパーコンピューターでは、異なるキューに対して異なるノードを使用することが観察されますが、私たちの場合は小さなクラスターしかなく、キュー間でリソースを共有することは意味がありません。

ありがとう。