Amazon EMR で wordcount の例を実行しようとしています。
-1- まず、次のコマンドでクラスターを作成します。
./elastic-mapreduce --create --name "MyTest" --alive
これにより、単一のインスタンスを持つクラスターが作成され、ジョブ ID が返されます。たとえば、j-12NWUOKABCDEF とします。
-2- 次に、次のコマンドを使用してジョブを開始します。
./elastic-mapreduce --jobflow j-12NWUOKABCDEF --jar s3n://mybucket/jar-files/wordcount.jar --main-class abc.WordCount --arg s3n://mybucket/input-data/
--arg s3n://mybucket/output-data/
--arg -Dmapred.reduce.tasks=3
私の WordCount クラスは abc パッケージに属しています。
これは問題なく実行されますが、レデューサーは 1 つしか取得できません。つまり、パラメーター「mapred.reduce.tasks=3」は無視されます。
アプリケーションで使用するレデューサーの数を指定する方法はありますか?
ありがとう、ニーラジ。