0

管理者権限のない Torque サーバーでジョブを実行しています。ただし、多くの場合、スロットは空いていると主張しているように見えますが、スケジューラーがそれにジョブを割り当てると、ジョブはキューに入れられたままになります。そのため、私のジョブの負荷がそのサーバーに割り当てられ、無期限にキューに入れられたままになります。

これらのジョブを開始する/別のマシンに移動する方法はありますか? それとも、ジョブを送信するときにマシンを避けますか? ありがとう!

4

1 に答える 1

0

root 権限がない場合は、システム管理者にジョブのブロックを解除してもらう必要がある場合があります。

  1. qstat -f の出力を確認して、ジョブがブロックされた理由を確認してください。利用可能なリソースよりも多くのリソースを要求した可能性があります。

  2. 将来、必要なノードを正確に指定します(管理者が許可していると仮定します) qsub somejob.sh -l

  3. Moab などのスケジューラを使用している場合は、次のコマンドを試してください (権限があると仮定して) mjobctl -u mjobctl -l
于 2013-03-31T04:43:43.090 に答える