0

In my HDFS i will be doing xml processing . ie processing an xml file and extracting 2 nodes.And this will be my x and y to plot a graph.

How can I do this .Generating graph from hdfs output.I want to use Rapid miner.how can i do this any idea...

OR ELSE

Is there a way to visualize my hadoop data

4

1 に答える 1

1

HDFS の仕組みは、ファイルを事前定義されたサイズのブロックに分割することです。それはまるで

split -b 64M file.xml

そして、各ブロックを取り、それを軟膏データノードに保存します。HDFS のブロック サイズが 64MB で、ファイル サイズが 1 GB の場合、ファイルは 16 ブロックに分割され、別の場所に保存されます。そのため、xml は単純な csv ファイルや tsv ファイルとは異なり構造化されているため、mapreduce ジョブは xml ファイル ブロックから意味を成すことができません。したがって、私が見る限り、hdfsブロックサイズよりも大きい場合、hdfsを介してxmlファイルを処理することはできません。

于 2013-04-10T17:56:31.910 に答える