2

構造化されていない巨大なログファイルの特定のキーワードを選択できるようにするLoadFunc関数を作成しました。タプルを引数として関数に渡すにはどうすればよいですか?

何かのようなもの

A = load '/input/*' using MyLoader('keyword1','keyword2');

また

A = load '/input/*' using MyLoader( ('keyword1','keyword2') );

エラーの原因:

grunt> a = LOAD '/input/*' USING MyLoader( ('keyword1','keyword2') );     
2012-08-28 19:44:04,331 [main] ERROR org.apache.pig.tools.grunt.Grunt - ERROR 1200: <line 3, column 36>  mismatched input '(' expecting RIGHT_PAREN
Details at logfile: /home/hadoop/pig-0.10.0/pig_1346159261142.log
4

1 に答える 1

2

実際には、Pig LoadFuncは、コンストラクターの文字列パラメーターのみを受け入れることができます。http://mail-archives.apache.org/mod_mbox/pig-user/201302.mbox/%3CCAO8ATY27UOdcgSjdh19F=iHsnFEAwmzedWbsnZ66sNvcsjfgog@mail.gmail.com%3Eを参照してください。

あなたの目的のために、私はCSVを文字列としてLoadFuncに渡し、それをLoadFuncのコンストラクター内で解析します。

于 2013-03-11T21:11:38.590 に答える