hadoop - Hadoop で不正な入力ファイルをスキップする

翻译自：https://stackoverflow.com/questions/19928849 2013-11-12T12:11:29.273

2335 次

Amazon Elastic MapReduce を使用して、S3 にアップロードされたいくつかのログファイルを処理しています。

ログファイルは S3 を使用してサーバーから毎日アップロードされますが、転送中に一部が破損したようです。これにより、java.io.IOException: IO error in map input file例外が発生します。

Hadoop で不良ファイルをスキップする方法はありますか?

2 に答える 2