Nagios を使用してネットワークを監視し、素晴らしい結果を出しています。現在、私たちが苦労している新しい要件があります。
致命的ではないが重大なアプリケーション エラーが発生したことを Nagios に通知します。アプリケーションの実行は停止しませんが、調査が必要な何らかの問題があります。
問題が調査されたら、Nagios で問題を「フラグ解除」する何らかの方法が必要です。
syslog を使用してみましたが、最大の問題は、エラーがログに記録されると、サービスがエラー状態になり、回復する方法がないことでした。また、アプリケーションは重大なエラーを syslog に報告しますが、ほとんどの場合、「すべてクリア」エラーは報告しません。