フォームでデータを受け取ります
id1|attribute1a,attribute1b|attribute2a|attribute3a,attribute3b,attribute3c....
id2||attribute2b,attribute2c|..
私はそれをすべてフォームにマージしようとしています.idフィールドのタプルのバッグと、それにマージされた他のすべてのフィールドのリストを含むタプルが続きます。
(id1,(attribute1a,attribute1b,attribute2a,attribute3a,attribute3b,attribute3c...)) (id2,(attribute2b,attribute2c...))
現在、私はそれを次のように取得します
my_data = load '$input' USING PigStorage(|) as
(id:chararray, attribute1:chararray, attribute2:chararray)...
次に、FLATTEN、TOKENIZE、GENERATE、TOTUPLE、BagConcatなどのすべての組み合わせを試して、必要な形式にマッサージしましたが、豚に慣れていないため、理解できません。誰でも助けることができますか?オープン ソースの UDF ライブラリはすべて公正なゲームです。