ApachePigで1回のパスでテーブルをピボットできるかどうか疑問に思います。
入力:
Id Column1 Column2 Column3
1 Row11 Row12 Row13
2 Row21 Row22 Row23
出力:
Id Name Value
1 Column1 Row11
1 Column2 Row12
1 Column3 Row13
2 Column1 Row21
2 Column2 Row22
2 Column3 Row23
実際のデータには数十の列があります。
これは、awkを1回のパスで実行してから、Hadoopストリーミングで実行できます。しかし、私のコードの大部分はApache Pigであるため、Pigで効率的に実行できるかどうか疑問に思います。