みんな、ハイブで、私たちは使用します
select word,count(*) as cnt from table group by word order by cnt limit N
トップNクエリの場合。
速度が速くないことがわかっているので、countsketchアルゴリズムや別のアルゴリズムなど、top-kクエリの近似アルゴリズムについて学びます。
top-kクエリを高速化するために、ハイブに近似アルゴリズムを追加できますか?
みんな、ハイブで、私たちは使用します
select word,count(*) as cnt from table group by word order by cnt limit N
トップNクエリの場合。
速度が速くないことがわかっているので、countsketchアルゴリズムや別のアルゴリズムなど、top-kクエリの近似アルゴリズムについて学びます。
top-kクエリを高速化するために、ハイブに近似アルゴリズムを追加できますか?