Pig スクリプトで操作しているタプルは次のとおりです。
DUMP A
(4,20,53,31)
(21,3,40,16)
(15,51,12,3)
この関係 (A) を次のような別の関係 (B) に変換します。
DUMP B
(4,20)
(4,53)
(4,31)
(21,3)
(21,40)
(21,16)
(15,51)
(15,12)
(15,3)
つまり、すべてのタプルで最初のフィールドを保持し、フィールドごとに 1 つのタプルを取得します。前の例では、各タプルは 3 つの新しいタプルを提供する必要があります。私は取得する解決策を持っています:
DUMP B
(4,20)
(21,3)
(15,51)
(4,53)
(21,40)
(15,12)
(4,31)
(21,16)
(15,3)
これは良い結果ですが、順序が間違っています (毎回 FOREACH 演算子を使用します)。各タプルにフィールドを追加してから ORDER 演算子を使用することで正しい順序を取得できましたが、もっと簡単な方法があると思います。
何か案が?
ありがとうございました。