SQL にエクスポートできるテーブルに変換したい次のスキーマ データセットがあります。を使用してHIVEいます。次のように入力します
call_id,stat1,stat2,stat3
1,a,b,c,
2,x,y,z,
3,d,e,f,
1,j,k,l,
出力テーブルはcall_id主キーとして持つ必要があるため、一意である必要があります。出力スキーマは
call_id,stat2,stat3,
1,b,c, or (1,k,l)
2,y,z,
3,e,f,
DISTINCT問題は、HIVEクエリでキーワードを使用するDISTINCTと、結合されたすべての列に適用されることです。のみに DISTINCT 操作を適用したいcall_id。ライン上の何か
SELECT DISTINCT(call_id), stat2,stat3 from intable;
ただし、これは有効ではありませんHIVE(私はSQLにも精通していません)。
唯一の法的な質問は
SELECT DISTINCT call_id, stat2,stat3 from intable;
しかし、これは他の列と同じ複数の行を返しcall_id、行全体が異なります。
注: a、b、c、x、y、z などの間に算術関係はありません。そのため、平均化や合計のトリックは実行できません。
どうすればこれを行うことができますか?