それぞれ 2 つのノードと 2 つのクアッドコア プロセッサを備えた Debian クラスタがあります。Torque と Maui をスケジューラとして使用しています。16 個のプロセスで MPI ジョブを実行しようとすると、スケジューラはジョブを実行できません。(その時点で実行中のジョブはありませんが) ジョブをキューに入れるか、実行して、結果の出力ファイルに次のように表示されます。 4 つのプロセッサのみで 16 プロセスのジョブを実行しようとしました。
私の .../pbs/server_priv/nodes ファイルは次のようになります。
node1 np=8
node2 np=8
プログラムを実行するために使用しているスクリプトの例は次のとおりです。
#!/bin/sh
#PBS -d /home/bellman/
#PBS -N output
#PBS -k oe
#PBS -j oe
#PBS -l nodes=2:ppn=8,walltime=10000:00:00
#PBS -V
ulimit -s 536870912
# How many procs do I have?
NP=$(wc -l $PBS_NODEFILE | awk '{print $1}')
echo Number of processors is $NP
mpiexec -np 16 /home/bellman/AAA
ノードと ppn の組み合わせをたくさん試しましたが、2 つのエラーのうちの 1 つが発生します。何が起こっているかについてのアイデアはありますか?