Hadoop を初めて使用するので、半構造化データ (XML) を HDFS にインポートしたいと考えていました。リモートの場所から HDFS に XML データをインポートする方法と、それに使用されるオープン ソース ツールは何ですか? Flume は XML データを HDFS にインポートできますか? 前もって感謝します
1830 次
HDFS Java API を使用して HDFS にファイルを作成し、XML のコンテンツ全体を各ファイルに書き込むことを試みることができます。
はい、大量の XML ファイルがソースから生成され、HDFS にシンクする必要がある場合は、flume を使用することもできます。
これらのリンクを見ることができます: http://www.dummies.com/how-to/content/log-data-with-flume-in-hdfs.html