最新の sensu コア バージョン 0.26.1 を使用しており、ある CentOS マシンに sensu サーバーをセットアップし、別の sensu クライアントに 1 つの sensu クライアントをセットアップしています。
1 つの sensu クライアントで約 500 のチェックがあり"previous check command execution in progress"
、sensu-client.log で見続けていますが、各チェックは実際には非常に速く終了します (ほとんどのチェックは 0.1 秒未満で、間隔は 60 秒です)。sensu
ユーザーsudo su sensu -c "{run my check}"
。
しかし、実際の状況では、うちわダッシュボードで、私のチェックの多くが 1 分以上実行されていることが示されています。sensuクライアントが深刻なスタック/スローになっているようです。次のアプローチを試しました。
- 長時間実行されているいくつかのチェックを削除し、sensu サーバー/クライアントを再起動します
- チェックにタイムアウト定義を追加し、タイムアウトを 10 に制限すると、多くのチェック「実行タイムアウト」が発生しました。
- 1、10、50 のチェックのみを実行しようとしましたが、すべて正常に動作しているように見えましたが、チェックのカウントが特定の数 (おそらく 200 ~ 300) に達するとすぐに、問題が発生しました。
上記のどちらも機能しません。実際にブロックしているチェックをデバッグする方法はありますか? timeout
または、定義を超えたときにチェックを単純に強制終了するように sensu を構成できますか? ログにこのメッセージが表示されないように、「前のチェックコマンドの実行が進行中です」
私はこれによってブロックされ、助けが必要です:)