豚で遊んで、私の入力ファイルは次のとおりです。
1、4、6
1、2、7、9
2、5、1
1、3、5、1
2、6、2、8
各行の最初の値は ID です。行の残りの部分は単純に一意の値です (各行は異なる数の列を持つことができます)。
上記を次のように転置したい:
1、2、4、6、7、9、3、5、1
2、5、1、6、2、8
したがって、基本的には ID でグループ化してから、残りの列をフラット化し、それを各行として出力します。
ここでもPIGは正しいアプローチですか?M/R でこれを行う方法はありますが、Pig はこの種のことには理想的かもしれないと考えました。
提供されたヒントに感謝します
ダンカン
PS私は値の順序を気にしません。