ここでは、カーディナリティの高いインデックスの操作に関心があります。(Elastic Search の問題として知られているもの)
私たちはすでにあなたからそれを知っています
select count(distinct high_cardinality_field) from my_table
カウントするための最適化がすでにいくつかあります。いつか次のようなものを書くことが可能になるでしょうか?
select count_via_hyperloglog(high_cardinality_field) from my_table
count_via_hyperloglog を UDF または何かとして持つことは、ES プラグインを介して ES で現在可能であるためですか?