0

現在、AWS SDK を使用してコピーしたい Hadoop コマンドがあります。

現在使っているコマンド

hadoop jar /home/hadoop/contrib/streaming/hadoop-streaming.jar -input /no_dups -output /sorted -mapper mapper.py -reducer reducer.py -file mapper.py reducer.py other_file1.py other_file2.py

私の知る限り、このStreamingStepクラスは、マッパーとリデューサーに加えて、他のファイルが必要になることを Hadoop に知らせる方法を提供していません。

この機能は利用できますか?

4

1 に答える 1

0

-fileオプションHadoopJarStepConfigを必要なファイルのリストとともに渡すことで、これを解決しました。

この質問を参照してください

于 2013-04-29T09:43:26.260 に答える