SGE キューで並行して実行する多数のジョブを送信するスクリプトと、このジョブのリストが終了したときに実行される別の収集スクリプトがあります。-hold_jid wc_job_list
並列ジョブの実行中に収集スクリプトの実行を保留するために使用しています。
いくつかの並列ジョブが失敗し、収集スクリプトがまだ実行されていることに気付きました。ドキュメントには次のように記載されています。
参照されたジョブのいずれかが終了コード 100 で終了した場合、サブミットされたジョブは実行できないままになります。
失敗した並列ジョブの終了ステータスをキャッチして、それらのいずれかが何らかの理由で失敗した場合、収集スクリプトが実行されないか、エラー メッセージが表示されるようにするにはどうすればよいですか?