0

文字列のいくつかのタプルを保持する Pig UDF から生成された多数のデータバッグがあるとします。それらをすべてデータバッグから取り出して、各文字列を独自のデータ「行」にする方法はありますか。

databags = FOREACH data GENERATE pigUdfThatMakesDataBags(data::someText); strings = FOREACH databags { ??? };

4

2 に答える 2

1

FLATTENを探しているということでよろしいですか?

于 2016-02-24T22:25:00.443 に答える
1
databags = FOREACH data GENERATE pigUdfThatMakesDataBags(data::someText);
datatuples = FOREACH databags FLATTEN($0);      -- Bag to Tuples 
strings = FOREACH datatuples FLATTEN(TOBAG(*)); -- Tuples to Tokens'
DUMP strings;
于 2016-02-25T01:15:41.640 に答える