多くのサブディレクトリに多くのファイルがあり、すべてのファイルはカンマで区切られています。各ファイルの最初のフィールドでグループ化し、合計レコード数を実行したい
A = LOAD '/files/*' USING PigStorage(',') as (f1, f2, f3, f4, f5);
B = GROUP A ALL;
C = GROUP B BY f1;
D = FOREACH C GENERATE COUNT(f1) ;
DUMP D;
このコードは私にエラーを与えます
フィールド投影が無効です。射影されたフィールド [f1] はスキーマに存在しません: group:chararray,A:bag{:tuple(f1:chararray,f2:bytearray,f3:bytearray,f4:bytearray,f5:bytearray)}。