Hadoop を使用して、次の xml を別々のノードに分割しようとしました
<?xml version="1.0" encoding="UTF-8" ?>
<pages>
<page>
<title>Sourav</title>
</page>
<page>
<title>Gaurav</title>
</page>
<page>
<title>sachin</title>
</page>
<page>
<title>Rahul</title>
</page>
</pages>
お気に入り
<page>
<title>abc</title>
</page>
次のコマンドで実行しました
hadoop jar /usr/lib/hadoop-0.20-mapreduce/contrib/streaming/hadoop-streaming-2.0.0-mr1-cdh4.0.1.jar -inputreader "StreamXmlRecordReader,begin=<page>,end=</page>" -input /usr/root/xml -output /usr/root/xmloutput
しかし、4つの単一ノードの代わりに、次の出力が得られました
<page>
<title>Sourav</title>
</page>
<page>
<title>Gaurav</title>
</page>
<page>
<title>sachin</title>
</page>
<page>
<title>Rahul</title>
</page>
と
<page>
<title>sachin</title>
</page>
<page>
<title>Rahul</title>
</page>
私は何か間違ったことをしていますか?私が間違っていることについての洞察は大歓迎です。