algorithm - ハイブのトップkクエリの近似アルゴリズム？

翻译自：https://stackoverflow.com/questions/12050125 2012-08-21T07:28:28.970

351 次

みんな、ハイブで、私たちは使用します

select word,count(*) as cnt from table group by word order by cnt limit N

トップNクエリの場合。
速度が速くないことがわかっているので、countsketchアルゴリズムや別のアルゴリズムなど、top-kクエリの近似アルゴリズムについて学びます。
top-kクエリを高速化するために、ハイブに近似アルゴリズムを追加できますか？

0 に答える 0