現在、Hadoop Pig の使用方法を学んでいます。
次のような入力ファイルがある場合:
a,b,c,true
s,c,v,false
a,s,b,true
...
最後のフィールドは私が数えなければならないものです...だから私はこのファイルでいくつの「真」と「偽」を知りたいのです。
私は試します:
records = LOAD 'test/input.csv' USING PigStorage(',');
boolean = foreach records generate $3;
groups = group boolean all;
今、私は立ち往生しています。使いたい:
count = foreach groups generate count('true');"
「true」の数を取得するには、常にエラーが発生します:
2013-08-07 16:32:36,677 [メイン] エラー org.apache.pig.tools.grunt.Grunt - エラー 1070: インポートを使用してカウントを解決できませんでした: [、org.apache.pig.builtin。、org.apache .pig.impl.builtin.] ログファイルの詳細: /etc/pig/pig_1375911119028.log
問題がどこにあるか誰か教えてもらえますか?