Pig で作業している間、私はうなり声シェルで作業しています。
のテーブルA
がありますcolA
。
テーブルをグループA
化しcolA
、これをファイルgrACount
に保存し、フィルタ結果をgrACount
と呼ばれるファイルに保存しますgrACountFilter
。
grunt シェルで次のようなステートメントを記述した場合:
grA = GROUP A BY colA;
grACount = FOREACH grA GENERATE group as colA, COUNT(A.colA) as countColA;
STORE grACount into 'grACount';
grACountFilter = FILTER grACount BY countColA>15;
STORE grACountFilter into 'grACountFilter';
次に、3 行目でマップ削減ジョブを送信し、5 行目で再度送信しますよね?
そして、5 行目でジョブを再度送信すると、テーブルが再計算されますよね?
私が望むのは、2 つの異なるマップ削減ジョブを送信して、すべての計算を一度に実行する必要がないようにすることです。これは可能ですか?