0

ピッグラテンでこのようなことをすることはできますか?

data1 = LOAD 'hadoop/text1.txt' AS (line:chararray);
data2 = LOAD 'hadoop/text2.txt' AS (line:chararray);

mixed = FOREACH data1, data2 GENERATE data1:line, data2:line;
4

1 に答える 1

2

一般に、データは複数のマッパーによって (おそらく一度に 1 行ずつ) ロードされるため、求めていることを実行しても意味がありません。対応する行が同じマッパーによって表示されるという保証はなく、マッパーがどのブロックのどの行を読み取っているのかを認識しているという保証もありません。WinnieNicklaus が述べたように、最善の方法は行にラベルを付けて結合することです。

于 2012-11-15T18:55:27.787 に答える