1

20 ノードのクラスター内の特定のノードでコードを実行する必要があります。クラスターは Cent OS で実行されます。ubuntu 12.04からssh接続しています。training.py という Python スクリプトを実行する必要があります。複数のバージョンの python がインストールされています (2.4、2.7、3.2)。Linux初心者なので、次の疑問があります。

qrsh コマンドの場合:

  1. コードを実行する特定のノードを選択する方法は?
  2. システムがデフォルトで 2.4 を実行している場合、Python バージョン 2.7 を選択する方法。

qsub コマンドの場合

  1. スクリプトを使用してジョブを送信する方法。私はスクリプトを書くのが初めてです。チュートリアルを提案してください。しかし今のところ、training.py をキューに入れる単純なスクリプトが非常に役に立ちます。
  2. スクリプトでは、実行する python のバージョンについて言及する必要があります。
  3. 異なる値が training.py に渡されるときに、parameters.py と training.py を複数回連続して呼び出す実験を設計したいと考えています。どうやってやるの ?

前もって感謝します ?

4

1 に答える 1

2

qsub にはさまざまなディストリビューションがあり、それぞれに独自の構文 (pbs_pro、torque、openpbs) があります。

トルクバリアントを使用している場合は、ドキュメントの第 2 章を確認してください。 http://docs.adaptivecomputing.com/torque/help.htm

基本的に、あなたはそのように仕事を提出します

qsub -l nodes=1:ppn=2 -l walltime=300 -l node=foo training.py

または、これらのフラグをジョブ送信スクリプトの一部として追加することもできます。

cat training.py
#!/usr/bin/python
#PBS nodes=foo
#PBS walltime=300

使用する Python のバージョンを指定するには、自分で Python をインストールするか (root を持っていると仮定)、システム管理者にノードに Python 2.7 をインストールするよう依頼する必要があります。

于 2013-10-01T15:47:21.853 に答える