6

次のコマンドで実行している単純な test.ksh があります。

スバッチ test.ksh

「JobState=FAILED Reason=NonZeroExitCode」を取得し続けます (「scontrol show job」を使用)

私はすでに次のことを確認しています。

  1. slurmd と slurmctld が正常に稼働している
  2. 「test.ksh」のユーザー権限は777です。
  3. コマンド "srun test.ksh" (sbatch を使用せずに単独で)は問題なく成功します。
  4. 「test.ksh」の最後の行に「return 0」を入れてみましたが、うまくいきませんでした
  5. 「test.ksh」の最後の行に「exit 0」を入れてみましたが運が悪かったです
  6. 「test.ksh」の最後の行に「ホスト名」を入れてみましたが、うまくいきませんでした
  7. 「test.ksh」の最後の行に「srun hostname」を入れてみたがうまくいかなかった
4

1 に答える 1

6

--error と --output を設定していないことがわかりました。つまり、デフォルトは、コマンドを発行した現在のディレクトリでした。

問題は、現在のディレクトリに書き込むための十分な権限がなかったことです。

解決策は、 --error と --output を、権限のある場所のディレクトリに設定することでした。

于 2015-01-22T17:07:23.063 に答える