単一の JAR ファイルから、hadoop クラスターでいくつかの map reduce ジョブを実行してきました。JAR の Main は、XML ファイルをコマンド ライン パラメータとして受け入れます。XML ファイルには、各ジョブの入力パスと出力パス (名前と値のプロパティのペア) が含まれており、これらを使用して各 mapreduce ジョブを構成します。次のようにパスを構成にロードできます
Configuration config = new Configuration(false);
config.addResource(new FileInputStream(args[0]));
Amazon の Elastic MapReduce を使用して JAR を実行しようとしています。XML ファイルを S3 にアップロードしようとしましたが、もちろん FileInputStream を使用して S3 からパス データをロードすることはできません (FileNotFound Exception)。
EMR を使用する場合、XML ファイルを JAR に渡すにはどうすればよいですか?
(私はブートストラップアクションを見ましたが、私が知る限り、それはhadoop固有の構成を指定することです)。
任意の洞察をいただければ幸いです。ありがとう。