マッパータスク(またはレデューサータスク)で未処理の例外が発生するとタスクが失敗するのか、それとも時間の特定の入力ペアのみが無視されるのか疑問に思っていますか?前者だと思いますが、よくわかりません。
2 に答える
2
エラー次第です。いずれにせよ、マップをラップしてロジックを try-catch ブロックで削減することを常に心がけています。エラーが発生すると、例外クラス名から派生した名前のカウンターをインクリメントします。これにより、hadoop の残りの部分が論理エラーから保護されるだけでなく、ログを見るだけでどの程度問題が発生したかがわかります。
于 2012-07-09T19:32:19.180 に答える
1
例外が繰り返されない場合 (つまり、再試行が成功する場合)、タスクは失敗しますが、タスクは再試行されます (または、並列で実行されている投機的実行が続行される場合があります)。例外が常に発生する場合 (不正な入力データがある場合など)、再試行は失敗し続け、最終的にジョブ全体が失敗します。
于 2012-07-09T19:32:02.557 に答える