1

私がいる環境は、約 100 のデータベース、Web、およびその他をサポートしています。他のサーバー (99% Windows)。インフラストラクチャ (ハードウェア + ネットワーク) はコンサルタントが管理し、私のグループはシステム開発を担当します。インフラストラクチャの担当者は、一般的なシステムの状態などを追跡するために使用される SCOM 環境をインストールしました。私は、それを使用してアプリケーションの状態を追跡することにも興味があります。

SCOM が、カスタム ルールを使用してカスタム開発されたアプリケーションを監視するのに適しているかどうかについて、誰か洞察を提供できますか? 私のチームには誰も SCOM を扱った経験がありません。私は、SCOM を学習するメリットと、スケジュールされた間隔で警告状態を探す Powershell スクリプトを実行するだけのメリットを比較検討しています。

私たちが監視したいいくつかのこと:

  • ログ ファイルをスキャンして、サービスの「ハング」などの特殊な状態を示す兆候がないか調べます
  • URL を呼び出して応答時間を監視する
  • URL を呼び出してエラー メッセージをスキャンする
  • データベースのクエリ アクティビティなどを監視します。

SCOM の経験がない (そして開発の観点から) ので、これらの種類のタスクは SCOM の機能にうまく適合しますか? Powershell、bat、cygwin スクリプト、またはGibraltarのようなツールを使用するのではなく、この種の監視を実装するために SCOM を学ぶことは理にかなっていますか?

4

1 に答える 1

0

ええ、あなたが求めていることはある程度可能です。私はこれを理解するために一日の大半を費やしたので、見つけたものをここに投稿しようと思いました.

任意のマシン上の任意のログの監視を設定できます。イベント ログ ビューアーでそのログイン ウィンドウを確認できる限り (実際には他にもたくさんありますが、ここで確認できる場合は、監視できると仮定します。

監視対象を SCOM の独自のグループに入れ、独自の管理パックをセットアップします。これらのアラートについてメールを受け取りたい場合は、「特定のグループ内の任意のインスタンスによって発生した」サブスクリプションに一致する基準でメールアラートを設定することもできます.

リモート サーバーの「アプリケーション」ログだけを監視する場合の例を次に示します。

  1. Operations Manager Authors または Administrators ロールのメンバーとしてオペレーション コンソールを起動します。

  2. オペレーション コンソールで。[オーサリング] ボタンをクリックします。

  3. ナビゲーション ペインで:

    1. [オーサリング] を展開し、[管理パック オブジェクト] を展開します。
    2. [ルール] を右クリックし、[新しいルールの作成...] をクリックして、ルールの作成ウィザードを開始します。
  4. [ルール タイプの選択] ページで、次の手順を実行します。

    1. [アラート生成ルール] を展開し、[イベント ベース] を展開して、[NT イベント ログ (アラート)] をクリックします。
    2. リスト (Windows コア ライブラリ - カスタマイズ) から目的の管理を選択するか、[新規...] をクリックして管理パックを作成します。
    3. [次へ] をクリックします。
  5. [ルール名と説明] ページで:

    1. [ルール名] ボックスに「アプリケーション イベント ログ エラー」と入力します。
    2. 必要に応じて、ルールの説明を入力します。
    3. [選択] をクリックして、対象とするアイテムを選択します。
    4. [ターゲットにする項目の選択] ダイアログで、[Windows コンピューター] を選択し、[OK] をクリックします。
    5. [ルールを有効にする] オプションがオンになっていることを確認し、[次へ] をクリックします。
  6. [イベント ログ名] ページで、[ログ名] が [アプリケーション] に設定されていることを確認し、[次へ] をクリックします。

  7. [イベント式の作成] ページで:

    1. 次の式を指定します。

      パラメータ名 演算子 値 イベント レベル 等しい エラー

    2. [次へ] をクリックします。
  8. [アラートの構成] ページで:

    1. [アラートの説明] ボックスで、次のように指定します。

ソース: $Data/EventSourceName$ イベント ID: $Data/EventDisplayNumber$ イベント カテゴリ: $Data/EventCategory$ ユーザー: $Data/UserName$ コンピューター: $Data/LoggingComputer$ イベントの説明: $Data/EventDescription$

2.  In the Severity option, click Warning.
3.  Click Alert suppression... to define the handling of duplicate alerts. In the 

[アラート抑制] ダイアログ: 1. 次のフィールドをクリックします。 イベント ID イベント ソース ログ記録 コンピュータ イベント カテゴリ ユーザー 説明 2. [OK] をクリックします。

  1. [作成] をクリックします。このプロセスを繰り返して、他のイベント ログのエラーに対して同様のアラートを作成します。

少しわかりにくいかもしれません (下手な書式設定では役に立ちません。申し訳ありません)。

これがとにかく仲間に役立つことを願っています、

李 J

于 2013-09-23T16:31:25.197 に答える