Windows Server にインストールされた Hadoop プラットフォーム (HortonWorks による) に取り組んでおり、Map/Reduce ファイルを C# でコーディングしています。
100k xml ファイルを含む入力フォルダーがあります。各xmlファイルを読み取り、各タグを1行に書き込みたい。以下の例に従ってください。
入力:
<Person>
<a>1</a>
<b>2</b>
<c>3</c>
</Person>
出力 1,2,3 .... ....
現在、データをどのように読み取るべきかについての情報を提供していただけますか。Mapper は、個々のタグを解析することが困難な各ファイルの個別のファイルで提供されます。