複数の物理マシン上の複数の仮想マシンでのHadoopデータの割り当てについて質問したいと思います。ファイルブロックのレプリカを異なる物理マシンに割り当て、各物理マシンのブロック数のバランスを保つための割り当て戦略を設計する論文を見つけました。そのため、ファイルブロックレプリカがすべて1台の物理マシン(複数のVMを含む)にスタックしないようにします。
その紙の仕事を実行してみたいです。複数のVMで構成される分散物理マシンに均等に割り当てられたファイルブロックレプリカを構成する方法に固執していました。mapreduceアルゴリズムでコーディングされていますか、それともhdfsインストールで構成されていますか?紙面では、仮想ノードの位置情報をネットワークトポロジに追加すると述べています。仮想ノードのネットワーク上の場所は、/default-rackから/Phy0に変更される場合があります。物理ノードのネットワークロケーションの下にレイヤーを追加します。
わからない、Hadoopでそれらを構成する方法??