AWS CloudFront アクセスログの分析に取り組んでいます。
ファイルの行をロードするコードがあります
raw_logs2 =LOAD 'file:///home/ec2-user/ENWRZAC68E00M.2011-02-28-18.72jA8eGh'
USING PigStorage('\t')
AS (
date: chararray, time: chararray, x_edge_location: chararray, sc_bytes: int,
c_ip: chararray, cs_method: chararray, cs_host: chararray, cs_uri_stem: chararray,
sc_status: chararray, cs_referer: chararray, cs_user_agent:chararray, cs_uri_query: chararray
);
今、クエリ文字列パラメータ(名前/値のペア)を解析しようとしています:
p=searchresults&s=homesforsale&gad=&gci=FOUNTAIN%2520VALLEY&gst=CA&gzi=&k=fountainvalleyca&ts=1298918206&
クエリ文字列の p、s および gci の値について、raw_logs2 テーブルに列を追加するにはどうすればよいですか?