文字列のいくつかのタプルを保持する Pig UDF から生成された多数のデータバッグがあるとします。それらをすべてデータバッグから取り出して、各文字列を独自のデータ「行」にする方法はありますか。
databags = FOREACH data GENERATE pigUdfThatMakesDataBags(data::someText);
strings = FOREACH databags { ??? };
文字列のいくつかのタプルを保持する Pig UDF から生成された多数のデータバッグがあるとします。それらをすべてデータバッグから取り出して、各文字列を独自のデータ「行」にする方法はありますか。
databags = FOREACH data GENERATE pigUdfThatMakesDataBags(data::someText);
strings = FOREACH databags { ??? };
FLATTENを探しているということでよろしいですか?
databags = FOREACH data GENERATE pigUdfThatMakesDataBags(data::someText);
datatuples = FOREACH databags FLATTEN($0); -- Bag to Tuples
strings = FOREACH datatuples FLATTEN(TOBAG(*)); -- Tuples to Tokens'
DUMP strings;