XMLLoader を使用して豚のラテン語スクリプトに XML をロードしています。次に、UDF で解析しています。問題は、入力ファイル名を UDF に組み込みたいということです。
何かのようなもの
fileName = (文字列)input.get(1);
参考までに、これが私のPig Latinコードです
REGISTER contrib/piggybank/java/piggybank.jar;
REGISTER TallyUDF.jar;
log = LOAD '/home/HadoopNaman1/pig/trunk/CompFetXML.xml' using org.apache.pig.piggybank.storage..XMLLoader('ENVELOPE') as xml_record;
N = FOREACH log GENERATE FLATTEN(TallyUDF.ParseCompFet(xml_record)) as (key:CHARARRAY,value1:CHARARRAY,value2:CHARARRAY);
M = FILTER N by key is not null;
DUMP M;
私は XMLLoader.java コードを編集する必要があると思います.しかし、私はそれを行う方法を考えることができません.