問題タブ [alertmanager]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
265 参照

prometheus-alertmanager - alertmanager がランダムにエラー メッセージを受け取る予期しないステータス コード 422

私はコミュニティ ヘルム チャート (14.6.0) からプロメテウスをデプロイしました。そこではアラート マネージャーが実行されており、時々エラー (テンプレートの問題) が表示され、エラー メッセージには特に有用なものは何も表示されません。質問は、amtool を介して構成を再テストしましたが、構成でエラーが発生しなかったことです。

監視は機能しており、アラートを取得していますが、このエラーがどのように変換されるかを理解したいだけです..デバッグモードを有効にすると、詳細情報が提供されないため、何が問題になる可能性があります.

アラートマネージャー構成:

0 投票する
1 に答える
84 参照

prometheus - プロメテウスはアラートを選択的に抑制します

特定の条件 (Tomcat がダウンするなど) が満たされたときに通知するアラート システムを作成する必要があります。異なる場所 (異なるタイム ゾーン) にデプロイされた複数のリモート サーバーが Tomcat サービスをホストし、Prometheus によって監視されています。現地時間の 8:05 から 22:45 の間だけアラートを受信する必要があるため、次のように進めます。

  1. サーバーの現地時間が [8:05,22:45] の場合は 1 を返し、それ以外の場合は 0 を返すカスタム ルール「check_system_time_in_interval」を定義しました。
  2. ルール 1) を使用して、「prometheus.rule.yml」で営業時間外にアラートを禁止するアラートを定義します。
  1. 「alertmanager.yml」ファイルで、監視対象のサーバー時間が間隔内にない場合にアラートTOMCAT ダウン(TOMCAT サービスが停止している場合にアラートを発生させる)を禁止する新しいinhibit_rule を定義しました。

TOMCAT down は、Tomcat が起動しているかどうかを確認するカスタム ルール「tomcat_up」を使用します。今ではかなり適切に動作しているようですが、このアプローチではタイムゾーンが原因で問題が発生します: Prometheus サーバーが配置されていても、監視対象サーバーのローカル時間が [8:05,22:45] にある場合は通知を受ける必要があります異なるタイムゾーンに。

簡単な解決策の 1 つは、check_system_time_in_interval 時系列の「インスタンス」ラベルが TOMCAT ダウンの「インスタンス」ラベルと等しい場合にのみアラートを禁止することです (たとえば、check_system_time_in_interval{instance="10.41.0.118"}=0 および tomcat_up{instance= の場合)。 「10.41.0.118}=1」はアラートを発しますが、それを行うために「inhibit_rule」を変更する方法がわかりません。

0 投票する
1 に答える
263 参照

prometheus-alertmanager - Alertmanager はデフォルトの受信者のみを通過します

タイトルにあるように、prometheus-operator の alertmanager に問題があります。ルートを使用していくつかのアラートをフィルタリングしようとしていますが、考慮されていないようです。

デフォルトのレシーバーを使用すると、すべてが正常に機能しているように見えますが、何もしないデフォルトのレシーバーでフィルタリングしようとすると、ルートに入らず、エラーは発生しません。

私が使用している秘密:

この構成では、すべてがデフォルト ルートに配置され、それらはルートに配置されず、エラーも発生しません。誰かがこれを機能させる方法についてアイデアを持っていますか?

0 投票する
2 に答える
433 参照

prometheus - Prometheus アラート ルールで条件演算子を使用して重大度を設定する

Prometheus の alert.rules 定義に条件演算子を使用して、特定の重大度を設定したいと考えています。たとえば、環境が本番環境の場合、重大度をクリティカルに設定したい場合は、別の値に設定します。

何かのようなもの: