1

私はdrmaa-pythonを使用して、SGE (Sun Grid Engine) との間でジョブを送信および監視しています。GUIで次のステータスがあります

  • キューでアクティブなジョブ
  • ジョブの実行
  • 完了したジョブ
  • 失敗したジョブ
  • ステータス未定

Status Undeterminedのジョブがほとんどない場合があります。SGE ホスト マシンのターミナルでqstatを使用してジョブのステータスを確認すると、すべてのジョブが 1 つも失敗することなく実行されていることがわかります。Status Undeterminedは、ユーザーに誤解を与えることがよくあります。これは、ユーザーがStatus Undeterminedジョブに何らかの問題があると考える可能性があるためです。

したがって、問題は SGE ではなく、drmaa-python ライブラリにあることがわかりました。

drmaa-python がステータスを判断できない理由を知っている人はいますか?

4

1 に答える 1

2

drmaa-pythonは、専用のロジックを持たない、DRMAACライブラリの単なる薄いctypeラッパーです。このため、表示されるUNDETERMINEDステータスは、SGEDRMAACライブラリが要求した瞬間に提供するものです。

私の知る限り、SGE用のDRMAACライブラリがステータスをフェッチできないことが時々発生する可能性があります。Pythonアプリケーションにカスタムの再試行ロジックを追加して、スケジューラーに再度要求することをお勧めします。

于 2013-02-28T20:10:20.173 に答える