1 ~ 7 日後の時系列データTTLs
(ユースケースによって異なります)。データは不変で、タイムスタンプ順 ( cluster by timestamp
) - データは「書き込み時」にタイムスタンプが付けられます (したがって、新しいデータのタイムスタンプは常にプログレッシブである必要があります)。
パーティションのサイズは 10,000 個のアイテムを超えてはなりません - 通常はそれよりもはるかに小さくなります (10MB
完全な 10,000 個のアイテムの場合は最大で ~)。
圧縮戦略の構成方法 (考慮すべきパラメーター) に関する適切なドキュメントが見つからなかったので、次のようにすることにしました。
compaction = {'class': 'TimeWindowCompactionStrategy', 'compaction_window_size': '7', 'compaction_window_unit': 'DAYS'}
これが正しいかどうかは確かにわかりません
KPI
考慮すべきことは何ですか?