以下は失敗します。
data = FOREACH rawData GENERATE (int) col;
aggregate = FOREACH data GENERATE MIN(col);
上記を機能させることができる方法はありますか?
私はこれを試しました:
data = FOREACH rawData GENERATE 1 dummy, (int) col;
grouped = GROUP data BY dummy;
aggregate = FOREACH grouped GENERATE MIN(data.col)
今私は得る:java.lang.Exception: java.lang.OutOfMemoryError: Java heap space
文字通り 11 行の整数 (1..11) があります...なぜ outOfMemoryError が発生するのかわかりませんか?
コマンドラインからスクリプトを実行していますpig -f myscript.pig
PIG は初めてなので、何か設定する必要がある場合はお知らせください...