1

私の元のカーボン ストレージ スキーマ構成は 10s:1w、60s:1y に設定され、数か月間正常に動作していました。最近、1s:7d、10s:30d、60s、1y に更新しました。次の bash を使用して、すべてのウィスパー ファイルのサイズを変更し、新しい保持スキーマを反映させました。

collectd_dir="/opt/graphite/storage/whisper/collectd/"
retention="1s:7d 1m:30d 15m:1y"

find $collectd_dir -type f -name '*.wsp' | parallel whisper-resize.py \
--nobackup {} $retention \;

whisper-info.py を使用して、正しい保持とデータ ポイントで更新されていることを確認しました。また、ストレージ スキーマ検証スクリプトを使用して、ストレージ スキーマが有効であることを確認しました。

carbon-cache{1..8}、carbon-relay、carbon-aggregator、および collectd サービスは、ウィスパーのサイズ変更前に停止され、サイズ変更が完了すると開始されました。

しかし、Grafana ダッシュボードにチェックインすると、collectd プラグイン グラフに正しいデータ ポイント (1 秒あたりのデータはありますが、データはありません) を含む空のグラフが表示されます。しかし、データを提供しているグラフでは、1 秒ではなく 10 秒ごと (古い保持期間) にデータとデータ ポイントが表示されます。

/var/log/carbon/console.log は問題ないようで、collectd whisper ファイルにはすべて carbon ユーザー アクセス権があるため、書き込み時にアクセス許可が拒否されることはありません。

グラファイト ホストのポート 2003 で ngrep を実行すると、リレーへの接続と送信されているメトリックが表示されます。これらのメトリクスは、8 つのキャッシュのプールから pickle ポートに中継されます。

他の誰かが同様の問題を経験しましたか、または問題をさらに診断するのに役立つ可能性がありますか? ここで何かを見逃しましたか?

4

1 に答える 1

0

そのため、これを理解するのに少し時間がかかりました。一部の古い応答のように local_settings.py ファイルとは何の関係もありませんでしたが、collectd.conf の Interval 関数とは関係がありました。

古い回答の多くは、各プラグイン コンテナー内に「間隔 1」を含める必要があると述べていました。各メトリックの制御により、これは素晴らしかったと思います。ただし、それはログに構成エラーを作成し、メトリックを壊します。構成の最上位で「間隔 1」を設定すると、問題が解決しました。

于 2019-07-16T19:08:00.937 に答える