0

キャッシュされ、DistributedCacheを介してマップリデュースジョブに配布されるファイルの小さなセットがあります。キャッシュされたファイルは、将来定期的に更新する必要があります。マップリデュースジョブを再開せずに、キャッシュされたファイルを更新できるかどうか疑問に思っています。

キャッシュされたファイルの変更タイムスタンプを追跡するDistributedCacheについて読みました。マップリデュースジョブで使用されていないときにファイルを更新するのに役立ちますか?

4

1 に答える 1

2

キャッシュされたファイルは、ジョブの送信時にHDFSにコピーされ、その後、M / Rタスクを生成する前に、さまざまなタスクトラッカーによってローカルノードにローカルにコピーされます。そのため、ジョブの実行中は分散キャッシュ内のファイルを変更できません。

于 2013-02-12T05:47:15.787 に答える