hadoop - Hadoop: 失敗したマップを再開する

Question

map reduce の耐障害性をテストしています。タスクノードの 1 つでネットワークサービスを停止すると、このノードに割り当てられたタスクが他のノードに再割り当てされることがわかりました。それはとても良いことです。

ただし、マッパーが例外をスローした場合 (例: ローカルリソースへのアクセスエラー)、MR ジョブは失敗したタスクを他のノードに再割り当てせずに完了します。

Hadoop に失敗したタスクを他のノードに再割り当てさせる方法はありますか? たぶん、いくつかの指定された例外をスローしますか?

ありがとう。

score 0 · Accepted Answer

タスクが例外をスローしているメソッドはどれですか?

TaskUmbilicalProtocol.done() メソッドから例外をスローしている場合は、別のアプローチを試すことができます。

TaskUmbilicalProtocol.fatalError() メソッドをオーバーライドして、例外をスローしてみてください。

1 に答える 1