map reduce を使用して、リモート システムから HDFS にデータを転送するアプリケーションがあります。しかし、ネットワーク障害のような問題に対処しなければならないとき、私は道に迷います。つまり、リモート データ ソースからの接続が失われ、mapreduce アプリケーションがデータにアクセスできなくなったときです。いつでもジョブを再開できますが、データが巨大な場合、再起動は高価なオプションです。mapreduce が一時フォルダーを作成することは知っていますが、そこにデータを配置しますか? そのデータを読み取ってから、どうにかして残りのデータの読み取りを開始できますか?
質問する
1445 次