3

本番環境でアプリケーションをどのように監視しますか? ログ、稼働時間など... (無料でオープンソースの外部アプリケーションを希望します)

たとえば、私は

  1. アプリケーションがダウンした場合にアラートを送信する機能
  2. CPU 使用率 > 設定されたしきい値の場合にアラートを送信
  3. メモリ使用量が設定されたしきい値を超えた場合にアラートを送信
  4. エラー メッセージのアラートを送信する
  5. Y 期間に X 回発生した場合、一部のエラーがアラートを送信する可能性があります。
4

5 に答える 5

1

Many people are moving to data-oriented solutions. While most monitoring tools (nagios etc) provide static charts, they are more silo, conventional views - todays apps highly distributed and transactions span multiple servers and things can get crazy. For more advanded functionality that goes beyond kpis and simple apis you need to look to machine data solutions like Logscape or Splunk. They allow you to create dashboards etc which are flexible and can be interactively drilled down to provide very rich root cause analysis. Look at some of the apps on this page LogscapeApps

于 2012-10-12T12:32:18.900 に答える
0

Nagios が最適です。少し学習曲線が必要ですが、カスタマイズ可能で強力です。ファイル、ディスク容量などを監視できるサーバー側のデーモンもあります。

于 2009-06-19T01:29:31.120 に答える
0

社内でカスタム構築された監視ソフトウェアがあります。

Web アプリケーションによって生成されたエラーについて、さまざまなライブ マシン (およびテスト) のイベント ログを監視します。すべての Web アプリケーションは、例外をエラー ログに書き込みます。また、サーバーに ping を実行し、ドライブ容量を監視します。

すべての開発マシンには、定義したすべてのサーバーを監視するサーバー アプリをポーリングするクライアント アプリケーションがあります。このクライアント アプリはタスク トレイで実行され、何か異常が発生したときにメッセージをポップアップ表示するため、開発者はすぐにそれを確認できます。また、テスターがいつエラーに遭遇したかを確認することもできます。通常、テスターがエラーを報告するまでに、修正または少なくとも修正が進行中です。

サーバーは配布グループにも電子メールを送信するため、必要に応じて仕事をしていないときに重要なエラーを確認できます。

また、定義済みの例外/エラーを抑制する機能もあります。

于 2009-06-19T01:52:00.983 に答える