通常の Java アプリケーションから map-reduce ジョブを呼び出せることはわかっています。私の場合、map-reduce ジョブは、hdfs 上のファイルと他のファイルシステム上のファイルを処理する必要があります。hdfs上のファイルを同時に使用しながら、他のファイルシステムからファイルにアクセスできることは、hadoopで可能ですか。それは可能ですか?
したがって、基本的に私の意図は、並列計算のためにHDFSに入れたい大きなファイルが1つあり、このファイルのブロックを他のファイルと比較することです(アクセスする必要があるため、HDFSに入れたくありません)フルレングスファイルとして一度に。