すべての map タスクとすべての reduce タスクが単一のノード (node1) で実行されていることに気付きました。node2にある単一のhdfsブロックで構成されるファイルを作成しようとしました。ノード 2 に常駐するこのブロックのみを入力とする mapreduce タスクを実行すると、タスクはノード 1 で実行されます。Hadoop は、入力データを含むノードでタスクを実行することを優先するという印象を受けました。ログ ファイルにエラーが報告されていません。ここで何が起こっているのでしょうか?
cloudera cdh4 分散インストール ガイドに従って作成した kvm で 3 ノード クラスターを実行しています。