0

サブノードの数が不明な XML データがあるとします。サブノードの数をパラメータとしてプログラムに入力し、それらを処理させる方法はありますか? 現在のコードはこのようなものです

    SourceXML = LOAD '$input' using org.apache.pig.piggybank.storage.XMLLoader('$TopNode') as test:chararray;

test2 = LIMIT SourceXML 3;

test3 = FOREACH test2 GENERATE REGEX_EXTRACT(test,'<$tag1>(.*)</$tag1>',1),
    REGEX_EXTRACT(test,'<$tag2>(.*)</$tag2>',1);

dump test3;

ただし、対象データに単純な要素がいくつあるか ($tag# がいくつあるか) は事前にわからない場合があります。次のようなパラメーターを含む .txt ファイルを使用したいと考えています。

input=/inputpath/lowerlevelsofpath

numberSimpleElements=3

tag1=タグ1名

tag2=タグ2名

tag3=タグ3名

入力ファイルの各タグで regex_extract が実行されている場合

これを達成する方法についてのアイデアはありますか?

4

1 に答える 1