0

HDFSのレプリケーション係数は少なくとも3である必要があります。3に選択する主な目的はフォールトトレランスであり、ラック障害の可能性はノード障害の可能性よりはるかに少ないという事実にもかかわらず、別の問題があります。複製係数が少なくとも3である理由は何ですか?

4

1 に答える 1

3

レプリケーション係数を 3 にしなければならない理由はありません。これは Hadoop のデフォルトです。HDFS 内のファイルごとに個別にレプリケーション レベルを設定できます。レプリカを持つ耐障害性に加えて、同じデータを消費するジョブを並行して実行できます。また、データのレプリカがある場合、Hadoop は同じタスクの複数のコピーを実行しようとし、最初に終了した方を取得できます。これは、何らかの理由でボックスが遅い場合に役立ちます。

于 2012-02-02T17:50:09.900 に答える