いくつかのドキュメントを確認しましたが、データの局所性を維持する Hadoop でのタスク スケジューリングに関して疑問があります。タスクの入力データt
がD1
で、レプリケーション ファクターが 3 であると仮定すると (つまり、3 つの異なるサーバーに D1 の 3 つのコピーが保存されていることを意味します)、t
が到着すると、どのサーバーt
に割り当てられますか? (デフォルトのスケジューラを考慮して)。
質問する
158 次