少なくとも 1 日に 1 回、私の Delayed::Job ワーカーはランダムにジョブをキューから停止しますが、プロセスはまだ生きています。
写真は「ゾンビ」
キュー内の残りのジョブを調べると、問題のゾンビ化されたワーカーによってロックされている/作業中であることを示すものはありません。失敗したジョブを見ても、失敗とワーカーがゾンビ モードに陥ることを明確に関連付けるのは困難です。
私は、ジョブにエラーがあり、ワーカーがセグメンテーション違反を起こすが、完全に死ぬわけではないという理論を持っています。ワーカー プロセスを調べて、それが何をしているかを確認する方法はありますか? 検査するスタックトレースや失敗したジョブさえない場合、この問題をデバッグするにはどうすればよいでしょうか?