私はここ数か月、Graphite+Grafana の満足のいくユーザーであり、社内でそれを提唱してきました。
私のアプローチは、関心のあるデータを測定し、それらを 1 分または 5 分のバケットに収集して、その情報を Graphite に送信することでした。私は最近、見積もり (1 日に数十億件!) を処理するグループから連絡を受けました。彼らのアプローチは、アプリケーションが 100 万件の見積もりを処理するたびにログ行を作成することでした。問題は、2 つのログ行の間の間隔が 1 秒から数時間まで非常に不規則になる可能性があることです。
ジレンマは次のとおりです: 保持ポリシーを 1 秒のバケットに設定して、スパイクに関連するすべての測定値を確認できるようにするか、保存するデータ ポイントの数を後で確認できるように、たとえば 1 分のバケットを使用する必要があります。 queryed の方がはるかに扱いやすいです。参考までに、1 秒に設定して 8 または 10 のグラフのデータを表示すると、データ ポイント (ほとんどが NULL) の数が原因で、数日間、システム (または少なくとも私のブラウザー) がクロールされていました。 Graphite から Grafana にプッシュ
これが私の保持ポリシーです: 1s:10d,1m:36d,5m:180d
または、Grafana+Graphite を構成して NULL 以外のデータ ポイントのみを取得する方法はありますか?
おすすめは何ですか?