サブノードの数が不明な XML データがあるとします。サブノードの数をパラメータとしてプログラムに入力し、それらを処理させる方法はありますか? 現在のコードはこのようなものです
SourceXML = LOAD '$input' using org.apache.pig.piggybank.storage.XMLLoader('$TopNode') as test:chararray;
test2 = LIMIT SourceXML 3;
test3 = FOREACH test2 GENERATE REGEX_EXTRACT(test,'<$tag1>(.*)</$tag1>',1),
REGEX_EXTRACT(test,'<$tag2>(.*)</$tag2>',1);
dump test3;
ただし、対象データに単純な要素がいくつあるか ($tag# がいくつあるか) は事前にわからない場合があります。次のようなパラメーターを含む .txt ファイルを使用したいと考えています。
input=/inputpath/lowerlevelsofpath
numberSimpleElements=3
tag1=タグ1名
tag2=タグ2名
tag3=タグ3名
入力ファイルの各タグで regex_extract が実行されている場合
これを達成する方法についてのアイデアはありますか?