0

Pig で作業している間、私はうなり声シェルで作業しています。

のテーブルAがありますcolA

テーブルをグループA化しcolA、これをファイルgrACountに保存し、フィルタ結果をgrACountと呼ばれるファイルに保存しますgrACountFilter

grunt シェルで次のようなステートメントを記述した場合:

grA = GROUP A BY colA;
grACount = FOREACH grA GENERATE group as colA, COUNT(A.colA) as countColA;
STORE grACount into 'grACount';
grACountFilter = FILTER grACount BY countColA>15;
STORE grACountFilter into 'grACountFilter';

次に、3 行目でマップ削減ジョブを送信し、5 行目で再度送信しますよね?

そして、5 行目でジョブを再度送信すると、テーブルが再計算されますよね?

私が望むのは、2 つの異なるマップ削減ジョブを送信して、すべての計算を一度に実行する必要がないようにすることです。これは可能ですか?

4

1 に答える 1