pig では、データを次のようにマッサージしました。
(a,{(b,c),(d,e),(f,g)})
(h,{(i,j),(k,l)})
ここで、最初の項目はグループで、バッグはグループに関連するその他の値です。次の形式で取得したいと思います。
(a,b,c,d,e,f,g)
(h,i,j,k,l)
私は今いる場所にたどり着きました
grunt> j = foreach G {
>> o = order myvar by second;
>> generate group, o.(first,second);
>> };
したがって、バッグ内のタプルは現在順序付けされています。私が何かmystuff = foreach j generate group, flatten($1);
をすると、すべてが平らになり、グループ化されなくなります。
これは豚で可能ですか?もしそうなら、どのコマンドを見ればよいですか?