問題タブ [sre]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
84 参照

prometheus - プロメテウスはアラートを選択的に抑制します

特定の条件 (Tomcat がダウンするなど) が満たされたときに通知するアラート システムを作成する必要があります。異なる場所 (異なるタイム ゾーン) にデプロイされた複数のリモート サーバーが Tomcat サービスをホストし、Prometheus によって監視されています。現地時間の 8:05 から 22:45 の間だけアラートを受信する必要があるため、次のように進めます。

  1. サーバーの現地時間が [8:05,22:45] の場合は 1 を返し、それ以外の場合は 0 を返すカスタム ルール「check_system_time_in_interval」を定義しました。
  2. ルール 1) を使用して、「prometheus.rule.yml」で営業時間外にアラートを禁止するアラートを定義します。
  1. 「alertmanager.yml」ファイルで、監視対象のサーバー時間が間隔内にない場合にアラートTOMCAT ダウン(TOMCAT サービスが停止している場合にアラートを発生させる)を禁止する新しいinhibit_rule を定義しました。

TOMCAT down は、Tomcat が起動しているかどうかを確認するカスタム ルール「tomcat_up」を使用します。今ではかなり適切に動作しているようですが、このアプローチではタイムゾーンが原因で問題が発生します: Prometheus サーバーが配置されていても、監視対象サーバーのローカル時間が [8:05,22:45] にある場合は通知を受ける必要があります異なるタイムゾーンに。

簡単な解決策の 1 つは、check_system_time_in_interval 時系列の「インスタンス」ラベルが TOMCAT ダウンの「インスタンス」ラベルと等しい場合にのみアラートを禁止することです (たとえば、check_system_time_in_interval{instance="10.41.0.118"}=0 および tomcat_up{instance= の場合)。 「10.41.0.118}=1」はアラートを発しますが、それを行うために「inhibit_rule」を変更する方法がわかりません。

0 投票する
1 に答える
82 参照

amazon-web-services - Terraform を使用して複数の AWS ClientVPN ルートを追加する方法

AWS コンソールから手動で作成された AWS clientVPN があり、約 20 プラスのルート テーブル エントリがあります。ここで、これをテラフォーミングして、テラフォーミングを使用して新しいルートを追加できるようにします。

Terraform インポートを使用して ClientVPN 情報をインポートしました。既存のすべてのルートをインポートするには、一度に 1 つのルートをインポートすることもできます。ルートごとにインポートすることもできます。以下に示すように、main.tf にリソース エントリを追加する必要があります。

ルートをインポートするたびに、main.tf にリソースを追加する必要があります。20 個のルート テーブル エントリがある場合、main.tf ファイルに 20 個のリソース エントリを書き込む必要がありますか?

main.tf で 1 つのリソース エントリを使用したいだけですが、どうすれば可能ですか?

インポート後、terraform プランを実行したときに、出力を確認します。

リソース名が一致していないため、破棄して再度作成しています。しかし、テラフォーム適用を行うと、最初にリソースを作成し、同じ CIDR のために失敗するため失敗します。

0 投票する
0 に答える
11 参照

elastic-stack - 稼働時間監視サービスの検出 (Elastic Stack 内)

Elastic Uptime でアプリケーションとサービスの何らかの検出/自己登録を行うことは可能ですか?

エラスティック管理者を煩わせることなく、アプリケーションが必要な稼働時間チェックとアラートを登録できるようにするには?