IEEE「仮想クラウドでの位置認識 MapReduce」から入手したこのペーパーワークを実装してみたいと思います。概要: 8 台の物理マシン、各マシンには 4 つの仮想マシンが含まれ、各 VM には Hadoop hdfs がインストールされています。p 個の物理マシンを含むクラスターがあり、それぞれにハード ディスクがあり、レプリカ番号が 3 であるとします。この場合、n 個のファイル ブロックが、クラスター外の別のコンピューターからクラスターに配置されるか、クラスター内でランダムに生成されます。モデルは、特定のデータ パターンを使用したデータ パターンの生成とタスク パターンの生成に関するものです。各ブロックは、同じ数の仮想マシンをホストする物理マシンに同じ確率で配置されます。Hadoop 戦略のデータ割り当てはランダムであるため、データ パターンが発生する可能性があります。 http://imageshack.us/photo/my-images/42/allstack.png/
提案された戦略は、理論的には次のように、ラウンドロビン割り当てと蛇行割り当てです: http://imageshack.us/photo/my-images/43/proposed.png/
いくつかの仮想マシンが 1 つの物理マシン上にあることを Hadoop に認識させる方法は??
同じ物理マシン上の仮想マシンにファイル ブロックの 2 番目と 3 番目のレプリカをレプリケートしないように Hadoop を作成するには??? そのような実装方法について尋ねたところ、ラック認識構成を使用しているとの返事がありました。しかし、私はまだ混乱しており、それについてさらに参照が必要です。
これらのデータ、物理マシンに均等に分散されたファイル ブロックのレプリケーションを追跡するにはどうすればよいですか? ラックの認識に従って構成した場合、物理マシンに均等に分散されたファイル ブロックのレプリカは確かですか??