hadoop - 単一ノードクラスターで Hadoop を実行している場合、HDFS はどのように機能しますか?

翻译自：https://stackoverflow.com/questions/19986437 2013-11-14T19:20:24.337

2508 次

データの局所性と、マルチノードクラスターでの動作MapReduceと動作について説明するコンテンツが多数あります。HDFSしかし、単一ノードのセットアップに関する情報はあまり見つかりません。私が実験している過去 3 か月間、私Hadoopは常にマッパーとリデューサーの数に関するチュートリアルとスレッドを読み、ジョブを最適化するためのカスタムパーティショナーを作成していますが、それは単一ノードクラスターに適用されるのでしょうか?

MapReduceマルチノードクラスタと比較して、単一ノードクラスタで実行中のジョブの損失はどのくらいですか?

この場合でも、入力データを分割することによって提供される並列処理は適用されますか?

単一ノードからの入力の読み取りHDFSとローカルファイルシステムからの読み取りの違いは何ですか?

私の経験が少ないため、これらの質問に明確に答えることはできないと思います。

前もって感謝します！

編集: @TC1 によってリストされたすべての要因により、Hadoop は単一ノードのセットアップには適していないことを理解しています。では、疑似分散 Hadoop 環境をセットアップする利点は何でしょうか?