hdfs から 1 GB のファイルを取得するには、クラスターの各ノードが必要です。FileSystem の copyToLocalFile メソッドを使用します。ただし、ファイル全体 (1GB) ではなく、各ノードが約 50MB のファイルを取得してから、コードが続行されます。その結果、私の仕事は失敗します。これはなぜですか?ファイル全体がローカル fs にコピーされるまで「待機」する方法はありますか?
編集: 私のマッパー クラスは、ファイルがノードのローカル fs に存在するかどうかを確認し、存在しない場合はそれを取得します。これは setup() 関数で行われます。