私のチームは、約 350 万の一意の URL を持つ非常に動的なトラフィックの多い Web サイトを担当しています。週に約 1 回アプリケーションを展開し、週に約 100 件の更新を更新する CMS を使用し、内部データ ソースも週に約 1 回リリースし、約 10 個の他のパブリック Web サービスを使用します。すべてが稼働していることを確認するのは、常に私たちのチームの責任です。
pingdom を使用して一部が稼働していることを確認していますが、いくつかのチェックに限定されており、必要な数の URL を処理できません。
Nagios も使用していますが、これは少しブラック ボックスであり、開発チームによって完全には採用されていません。私たちの開発者のほとんどは、ウィンドウに焦点を当てており、すべての構成を考えてうんざりしています。
私たちが必要としているもののほとんどは、いくつかの URL を監視することと、何かがダウンしたり変化したりしたときに通知してくれるものです。