次の豚ラテン スクリプト:
data = load 'access_log_Jul95' using PigStorage(' ') as (ip:chararray, dash1:chararray, dash2:chararray, date:chararray, date1:chararray, getRequset:chararray, location:chararray, http:chararray, code:int, size:int);
splitDate = foreach data generate size as size:int , ip as ip, FLATTEN(STRSPLIT(date, ':')) as h;
groupedIp = group splitDate by h.$1;
a = foreach groupedIp{
added = foreach splitDate generate SUM(size); --
generate added;
};
describe a;
エラーが表示されます:
ERROR 1045:
<file 3.pig, line 10, column 39> Could not infer the matching function for org.apache.pig.builtin.SUM as multiple or none of them fit. Please use an explicit cast.
このエラーにより、サイズを int としてキャストする必要があると思われますが、groupedIp
フィールドを記述すると、次のスキーマが得られます。
groupedIp: {group: bytearray,splitDate: {(size: int,ip: chararray,h: bytearray)}}
size が int であり、sum 関数で使用できることを示します。
sum 関数を間違って呼び出していますか? 入力ファイルなど、他に何か見たいことがあれば教えてください。