HadoopクラスターでMapReduceジョブを実行するときの一連のイベントに関する特定の情報を探しています。
私のReduceタスクが完了間近であると仮定しましょう。最後のレデューサーが出力を出力ファイルに書き込んだ後、出力ファイルのレプリカはいくつありますか?最後のレデューサーが出力ファイルへの書き込みを終了した後に正確に何が起こるか。NameNodeはいつ出力ファイルを複製するようにそれぞれのデータノードに要求しますか?そして、出力ファイルの準備ができたことをName Nodeにどのように通知しますか?誰がその情報をNameNodeに伝えますか?
ありがとうございました!