1

v エラスティックサーチ 5.6.*。

ストレージの制約を自動的に管理するために、インデックスの 1 つ (1 日あたり約 100 万のドキュメントがすぐに大きくなる) のメカニズムを実装する方法を検討しています。

例: ドキュメントの最大数または最大インデックス サイズを変数 'n' として定義します。「n」が真かどうかをチェックするスケジューラーを書きたいと思います。true の場合、(時間に基づいて) 最も古い 'x' ドキュメントを削除します。

ここでいくつか質問があります。

どうやら、削除しすぎたり、削除しすぎたりしたくありません。「x」が何であるかをどうやって知ることができますか? Elasticsearch に「5 GB 相当の最も古いドキュメントを削除してください」と簡単に言うことはできますか?私の意図は、単純に一定量のストレージを解放することです。これは可能ですか?

第二に、ここでのベストプラクティスは何ですか? 明らかに、私はここで四角い車輪を発明したくはありません。仕事をするものがあれば (例: キュレーターと最近聞いたばかりです)、喜んでそれを使用します。

4

3 に答える 3

1

https://discuss.elastic.co/t/elasticsearch-effectively-cleaning-up-the-indices-to-save-space/137019で同じ質問に回答しました

インデックスが常に増加している場合、ドキュメントの削除はベスト プラクティスではありません。時系列データがあるようです。true の場合、必要なのは時系列インデックス、またはロールオーバー インデックスです。

また、1 つの Elasticsearch シャードのサイズは 20GB ~ 50GB まで正常に増加する可能性があるため、5GB はパージするのにかなり小さい量です。ストレージに制約がありますか? ノードはいくつありますか?

于 2018-06-22T12:37:02.680 に答える