シナリオは次のとおりです。表record
は次のとおりです。
A | B | C
1 | 1 | 1
2 | 1 | 1
3 | 1 | 1
4 | 1 | 2
5 | 1 | 2
6 | 1 | 3
HQL: の結果は次のselect * from record where B = 1 and C < 3 limit 2
ようになります。
A | B | C
1 | 1 | 1
2 | 1 | 1
しかし、私が欲しいのは:
A | B | C
1 | 1 | 1
2 | 1 | 1
4 | 1 | 2
5 | 1 | 2
つまり、返されるレコードの最終的な数を制限するのではなく、すべての条件でレコードの数を制限します。
これは本当にhive だけで行う必要があります。誰か私にアイデアをくれませんか?どうもありがとう!
要約 すると、この問題を解決する良い方法があります: http://ragrawal.wordpress.com/2011/11/18/extract-top-n-records-in-each-group-in-hadoophive/