1

たとえば、次のような入力ファイルがあります。

xxx,14
yyy,20
zzz,11

2番目のフィールドと出力を合計したい。Hadoop Pig を使用して合計する方法はわかりましたが、次のような出力が必要です。

Canada,45

つまり、自分でキー名を「Canada」に設定し、SUM を値として追加するということです。自分でキー名を設定するにはどうすればよいですか?

4

1 に答える 1

2

定数フィールドを適用するだけです:

A = load 'data.txt' using PigStorage(',') as (txt:chararray, num:int);
B = group A ALL;
C = foreach B generate 'Canada' as country:chararray, SUM(A.num) as total:int;
于 2013-08-08T20:55:36.143 に答える