私は、16 ノードの Hadoop (バージョン 1.2.0) クラスターを使用します。1 つにはパブリック IP (マスター) があり、15 はプライベート ネットワーク (スレーブ) を介して接続されています。
マッパーの出力を保存するために、(これらの 16 ノードに加えて) リモート サーバーを使用することは可能ですか? 問題は、マップ フェーズ中にノードのディスク容量が不足し、マップ出力をこれ以上圧縮できないことです。
mapred.local.dirinmapred-site.xmlは、tmp ファイルが保存されているディレクトリのコンマ区切りリストを設定するために使用されることを知っています。理想的には、1 つのローカル ディレクトリ (既定のディレクトリ) とリモート サーバー上の 1 つのディレクトリが必要です。ローカル ディスクがいっぱいになったら、リモート ディスクを使用したいと思います。