フィールドが「?」で区切られている以下のようなファイルがあります。
(01-01-2011-04:43:50?2521795691802591407?94.20.58.165?
私が使うとき
mac = load 'Activity_1295336_01-01-2011.log.gz'using PigStorage('?');
たとえば、まだ内部フィールドにアクセスできませんmac$1
。
フィールドが「?」で区切られている以下のようなファイルがあります。
(01-01-2011-04:43:50?2521795691802591407?94.20.58.165?
私が使うとき
mac = load 'Activity_1295336_01-01-2011.log.gz'using PigStorage('?');
たとえば、まだ内部フィールドにアクセスできませんmac$1
。
私の側では期待どおりに動作します...
$> pig --version
Apache Pig version 0.9.2-cdh4.0.0 (rexported)
compiled Jun 04 2012, 17:42:27
$> cat temp1
01-01-2011-04:43:50?2521795691802591407?94.20.58.165?
grunt> a = load '/temp1' using PigStorage('?') as (datetime, id, ip);
grunt> dump a;
grunt> >> (01-01-2011-04:43:50,2521795691802591407,94.20.58.165,)
grunt> b = foreach a { funky = CONCAT(ip, '_-* FUNKY'); generate datetime, id, funky;}
grunt> dump b;
grunt> >> (01-01-2011-04:43:50,2521795691802591407,94.20.58.165_-* FUNKY)