スキーマ ファイルなしで袋に入れて Pig にロードしているとします。バッグ内の各タプルには、バッグでもある1つのフィールドが含まれていることがわかっています。
{
({1, 2, 3}),
({3,4,5}),
({1,2})
}
各タプルの最初の引数をバッグにキャストしたいと思います。どうすればそうできますか?
data = LOAD '/path/to/data' AS (f:bytearray);
data2 = FOREACH data GENERATE (bag)f; -- this doesn't work