0

センサーからの何千もの受信入力を処理する他のアクティビティの中で、kubernetes システムがあります。一部のセンサーは時々レポートを停止できるため、切断イベントに関するアラートを受け取ることができます。センサーが戻ってきたら、これに対するイベントも取得したいと考えています。そのため、これらのイベント (接続と切断) の間で、特定のセンサーのステータスが OK または NOK になる可能性があり、発行されたすべてのイベントを調べて毎回調べることなく、現在切断されているセンサーのステータスを確認したいと考えています。

Prometheus Alertmanager でそれを行うことはできますか? はいの場合、これを達成するための可能な方法を参照していただけますか? いいえの場合、この要件を処理するデフォルトの方法は何ですか?

4

1 に答える 1

1

これは、自己監視アラート、より正確には、ケースの PrometheusTargetMissing アラートを追加して、Prometheus サーバー側で管理する必要があります。

  - alert: PrometheusTargetMissing
    expr: up == 0
    for: 0m
    labels:
      severity: critical
    annotations:
      summary: Prometheus target missing (instance {{ $labels.instance }})
      description: A Prometheus target has disappeared. An exporter might be crashed.\n  VALUE = {{ $value }}\n  LABELS: {{ $labels }}

参照: https://awesome-prometheus-alerts.grep.to/rules.html#rule-prometheus-self-monitoring-2

于 2021-04-19T16:02:51.267 に答える