wordCount の例を見てみましょう:
input_lines = LOAD '/tmp/my-copy-of-all-pages-on-internet' AS (line:chararray);
-- Extract words from each line and put them into a pig bag
-- datatype, then flatten the bag to get one word on each row
bag_words = FOREACH input_lines GENERATE FLATTEN(TOKENIZE(line)) AS word;
スクリプトを実行するたびにバッグ全体を再構築する必要がないように、「bag_words」変数をシリアル化することは可能ですか?
ありがとう。