現在、InfluxDB 2.0 のドキュメントを勉強しています。ただし、バケット、測定、保持ポリシーの間のロジックはまだ完全には理解していません。
ドキュメントには、データベースと保持ポリシーがバケットに置き換えられたと書かれています。バケットは定義ごとです。
「時系列データが InfluxDB 2.0 に保存される名前付きの場所」
私の理解では
バケットにはシャード グループが含まれます=> シャード グループは、特定のフォルダーに特定の間隔のデータを格納します。例: シャード グループは、常に 4 時間間隔のデータを 1 つのフォルダーに保存できます。
シャード グループにはシャードが含まれます=> シャードは、時系列テーブルの単一の行/ポイントです。
さらに、Influx は、1 つのバケットには 1 つの保持ポリシーがあるとドキュメントに書いています。
これは、「バケット」が時系列を 1 つだけ格納し、複数の時系列を格納しないことを意味します。そうしないと、バケットに複数の保持ポリシーが含まれる可能性があります。
私の理解が正しい場合、これは、すべての測定値が同じ保持ポリシーを持っている場合にのみ、同じバケットに測定値を含めることができるということですか? 同じバケットに保持ポリシーが異なる 2 つの測定値がある場合、一方の保持ポリシーが他方の測定値からデータを削除する可能性があるためです。ここで混乱している場合は、修正してください。
ただし、私が正しい場合、これはハードウェア要件にどのように影響しますか?
Influx は、シリーズの数がハードウェア要件に影響を与えると述べています。
それは実際には、すべてのバケット/保持ポリシーがシリーズの数を増やし、それによってハードウェア要件が増えることを意味しますか?
たとえば、60,000 シリーズを 1 つのバケット VS バケット A に 20,000 シリーズを格納し、バケット B に別の 20,000 シリーズを格納し、バケット C に最後の 20,000 シリーズを格納する場合、違いはありますか?
フィードバックをお待ちしております。