24ノード、それぞれ12個のプロセッサ、および各ノード約64Gbのメモリを備えたコンピュータークラスターでコードを実行しています。それを起動するために使用しているコマンドは次のとおりです
#!/bin/sh
#PBS -N cclit
#PBS -l walltime=288:00:00
#PBS -l nodes=1:ppn=1
#PBS -j oe
#PBS -m n
#PBS -l mem=60000mb
残念ながら、私のコードには少なくとも 120000 MB の仮想メモリが必要であることに気付きました。私がやろうとしたことは、上記のコマンドを次のように変更することでした
#!/bin/sh
#PBS -N cclit
#PBS -l walltime=288:00:00
#PBS -l nodes=2:ppn=2
#PBS -j oe
#PBS -m n
#PBS -l mem=120000mb
しかし、うまくいかないようです...同じ時点で再び停止し、仮想メモリが不十分であることがわかります。私のコードは並列化されていません。つまり、必要なプロセッサは 1 つだけです。ノードのメモリが完全に使用されるとどうなりますか?? 私は「#PBS -l mem=120000mb」で何か間違ったことをしていると思います。あるいは、おそらく他のコマンドが必要です...ウェブで解決策を探してみましたが、何も見つかりませんでした..
手伝って頂けますか?
ありがとうミルコ。