0

私たちは、ネットワーク上のさまざまなサーバーとプロセスに監視を追加する過程にあり、現在、何か問題があると思われる場合、さまざまなモニターが私の開発グループに電子メールを送信します。応答しない、ベンダーへの毎日の自動化された FTP が失敗するなどです。これらの一部は情報提供であり、すぐに対処する必要があります (たとえば、明日または月曜日は問題ありません)。一部は重要であり、実際の顧客の停止の結果であるため、できるだけ早く復元する必要があります。

問題は、非常に多くの電子メールが送信され、人々が電子メールに対して鈍感になり、重要な電子メールさえも無視し始めていることです。毎週担当者が変わりますが、重要なアラートが何時間もそこに留まり、要求も応答もされないことがあります。

この種の監視と警告の状況により適切に対処するために、他の人々は何を行っていますか? その日のすべてを提供するダッシュボードまたは要約メールを用意する必要がありますか? では、重要なことについてはどうでしょうか。グループ メールは依然として最善の方法ですか? 問題が迅速に解決されるように他の人が何をしているのか、私は興味がありますが、開発者が圧倒されて何もしないように気をつけてください。

4

1 に答える 1

0

RHQ ( http://rhq-project.org/ ) には減衰イベントがあります。つまり、たとえばメールは 5 回のアラートごとにしか送信されません。

また、アラートで送信を無効にしてから、(エラー状況が解消された場合) 次のエラー状況が発生した場合に送信を再度有効にする 2 番目のいわゆる回復アラートを設定することもできます。

詳細については、 http://www.rhq-project.org/display/JOPR2/Alertsを参照してください。

于 2011-02-19T15:10:44.253 に答える