基本的にHDFSファイルシステムをMapReduceフレームワークから分離できるかどうか知りたいです。Hadoopの主なポイントは、問題のデータを含むマシンでマップを実行して縮小することですが、*。xmlファイルを変更して、jobtracker、namenode、およびデータノードはで実行されています。
現在、私の構成は2つのVMセットアップです。1つ(マスター)にはNamenode、Datanode、JobTracker、Tasktracker(およびSecondaryNameNode)があり、もう1つ(スレーブ)にはDataNode、Tasktrakerがあります。基本的に、変更したいのは、NameNode DataNode(s)、JobTrackerを備えたマスターを持ち、計算を実行するためにTaskTrackerのみを備えたスレーブを持ちます(後で、TaskTrackerのみを備えたスレーブをさらに増やします。それぞれに1つずつ)。 。ボトルネックは、マップの計算のための2つのVM間のデータ転送であり、削減されますが、この段階のデータは非常に小さいため、私は主にそれを気にしません。この構成が可能かどうか、およびその方法を知りたいだけです。任意のヒント?
ありがとう!