S3 で約 500 個のドキュメントに対してサンプルの Hadoop ジョブを実行しています。ローカルで実行すると、完了までに 15 分未満かかります。しかし、EMR で同じジョブを実行しようとすると、2 時間以上かかり、それでも削減ステップが完了しないため、終了しました。MapReduce
EMR でのジョブにこれほど時間がかかる特定の理由はありますか?
また、同じように、ボトルネックがどこにあるかを確認するために EMR をプロファイリングする最良の方法は何でしょうか? ログファイルが完了するまでレデューサーからログファイルを取得できないようですが、完了するまでに時間がかかりすぎています..