8 台のマシンを持つ Hadoop クラスターがあり、8 台のマシンすべてがデータ ノードです。HDFS にシーケンス ファイル (各ファイルは約 1GB) を継続的に作成する 1 台のマシン (マシン A など) で実行されているプログラムがあります。
ここに問題があります。8 台のマシンはすべて同じハードウェアであり、容量も同じです。他のマシンがまだ HDFS 用のディスクに約 50% の空き容量を持っている場合、マシン A には 5% しか残っていません。ブロック情報を確認したところ、ほぼすべてのブロックがマシン A に 1 つのレプリカを持っていることがわかりました。
レプリカのバランスを取る方法はありますか? ありがとう。