SQL にエクスポートできるテーブルに変換したい次のスキーマ データセットがあります。を使用してHIVE
います。次のように入力します
call_id,stat1,stat2,stat3
1,a,b,c,
2,x,y,z,
3,d,e,f,
1,j,k,l,
出力テーブルはcall_id
主キーとして持つ必要があるため、一意である必要があります。出力スキーマは
call_id,stat2,stat3,
1,b,c, or (1,k,l)
2,y,z,
3,e,f,
DISTINCT
問題は、HIVE
クエリでキーワードを使用するDISTINCT
と、結合されたすべての列に適用されることです。のみに DISTINCT 操作を適用したいcall_id
。ライン上の何か
SELECT DISTINCT(call_id), stat2,stat3 from intable;
ただし、これは有効ではありませんHIVE
(私はSQLにも精通していません)。
唯一の法的な質問は
SELECT DISTINCT call_id, stat2,stat3 from intable;
しかし、これは他の列と同じ複数の行を返しcall_id
、行全体が異なります。
注: a、b、c、x、y、z などの間に算術関係はありません。そのため、平均化や合計のトリックは実行できません。
どうすればこれを行うことができますか?