MYSQL からデータをインポートし、MR を実行して MYSQL にエクスポートする必要があります。DBInputFormat と DBOutputFormat を使用して、いくつかのレコードに対して単一の MR ジョブで正常に実行できます。入力レコードを 1 億以上のレコードにスケーリングすると、MR ジョブがハングします。これに代わる方法は、データを HDFS にエクスポートし、MR ジョブを実行して、My SQL にプッシュバックすることです。
約 4 億件以上のレコードの巨大なデータセットの場合、DBInputFormat と DBOutputFormat を使用するか、HDFS をデータ ソースと宛先として使用する方が適切です。
HDFS を使用すると、MR ジョブの前後にステップが追加されます。データは HDFS に保存されるため、レプリケートされ (デフォルトは 3)、より多くのハード ドライブ容量が必要になります。ありがとうルペッシュ