1

形式のデータがあります

1,1.2
2,1.3
and so on..

したがって、基本的にこれはidが一意であるid、valの組み合わせです...

すべての値の平均を計算したい..

So here.. avg(1.2,1.3)

私はドキュメントを調べていましたが、ほとんどの集計関数には、いくつかの ID によるグループ化が含まれます..次に AVG を使用します...しかし、ID は一意であるため..それらをグループ化するにはどうすればよいですか??? したがって、基本的にこの努力の結果は 1 つのフロートになります。どんな提案も大歓迎です。

ありがとう

4

1 に答える 1

2

GROUP X ALLあなたの問題を解決する必要があります:)

A = LOAD 'data' USING PigStorage(') AS (f1:int, f2:int);
B = GROUP A ALL;
AV = FOREACH B GENERATE AVG(A.f1);
DUMP AV;
于 2012-11-06T19:38:05.080 に答える