0

私はこのデータ構造を持っています

data: {mid: bytearray,country_code: bytearray,cnt: long}

4679201,RUS,1
4679201,GB,1
4679201,US,1
4681046,GB,2
4681046,TR,1
4681046,FR,1

各「中間」値をループし、対応するデータを「csv」ファイルに保存する必要があります。

STORE mid_data INTO '/mypath/4681046';

出力ファイルは次のようになります。

GB,2
TR,1
FR,1

キー(mid)を出力の一部にしたくないことを除いて、それを行う関数( org.apache.pig.piggybank.storage.MultiStorage )がすでにあるようです。

ありがとう

サデク

4

1 に答える 1

0

出力ファイルの最後の 2 列だけを保存するには、FOREACH を使用します。

元:

view = FOREACH mid_data GENERATE country_code, cnt;
STORE view INTO '/yourpath/3452345';
于 2012-08-08T21:42:59.097 に答える