問題タブ [telegraf]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
453 参照

influxdb - Grafana の誤った高い値により、誤ったアラートが発生する

昨日、Grafana でアラートを構成し、2 つのサーバーからアラートを受け取りました。高い IO、高い CPU などを取得したのは、常に同じ 2 台のサーバーです。

問題は、彼らはそれほど高いデータを持っていないということです。実際、彼らはほとんどアイドル状態です。すべてのサーバーは、Ansible を介してまったく同じように構成されています。したがって、Telegraf 構成はすべてのサーバーで同じです。

また、Grafana の統計を対応するサーバーにフィルターすると、下のスクリーンショットでわかるように、グラフに表示されるデータは正しくなります。それでも、Rule-Test の結果は誤検知になります。

サーバーの Grafana グラフのスクリーンショット (正しいデータと間違った結果の「テスト ルール」)

vmstatどちらが正しい情報を表示するかを確認しました:

そしてtelegraf.log何かがおかしい場合。

ここで何が問題なのですか?