Elasticsearch インデックスに文字列フィールドがあり、そのフィールドでパーセンタイルまたはクォンタイル集計 (数値フィールドでうまく機能します) を実行しようとしています。
文字列フィールドに 10,000 の名前または都市があると仮定すると、予想される結果は次のようになります。
4 つのバケットを要求する場合:
A-E (2500), F-K (2500), L-M (2500), N-Z (2500)
用語はアルファベット順に均等に分散されていませんが、バケットはほぼ同じサイズである必要があります。2600、2400、2800、2200 の用語カウントが許容されます。