AmazonEC2m1.smallインスタンスでMapReduceの単語数の例をテストしています。Amazonのコマンドラインスタートガイドに従いました。
bin /ec2hadooplaunch-clusterテスト2
このコマンドを使用すると、2つのスレーブノードがあります。(合計3つのインスタンスが実行されています)次に、マスターノードにログインしてhadoopプログラム(jarファイルにバンドルされています)を実行できます。35分かかりました。
スケーラビリティの実験では、4つのインスタンスを使用して同じプログラムを実行しました
bin /ec2hadooplaunch-clusterテスト4
驚いたことに、パフォーマンスの向上は見られませんでした。MapReduceアプリケーションはほぼ同じ時間(33分)かかりました
問題はどこにあるのでしょうか?それは許容できる行動ですか?
In mapred-site.xml
mapred.tasktracker.map.tasks.maximum is set to 1
mapred.tasktracker.reduce.tasks.maximum is set to 1
どんな提案でも大歓迎です。