こんにちは、Git リポジトリで map reduce ジョブを実行しようとしています。map ジョブを使用して、最初にすべてのリポジトリを hdfs に同時に複製し、次にファイルに対してさらに map reduce ジョブを実行したいと考えていました。リポジトリファイルをhdfsに書き込む方法がわからないという問題が発生しています。個々のファイルを書き込む例を見てきましたが、それらはマッパーの外部にあり、単一のファイルのみを書き込みます。jgit API は file から継承する filerepository 構造のみを公開しますが、hdfs は dataoutputstreams として記述されたパスを使用します。2つまたは同様のことを行う例を変換する良い方法はありますか?
ありがとう