私のhadoopプログラムは、入力データを/usr/countcomputers.txt
ファイルに設定されている特定の数の部分に分割する1つのマッパーを使用します(マッパー関数によって読み取られます)。さらに、一部は各レデューサーに到達します。したがって、/usr/countcomputers.txt
ファイルに設定されている数は、レデューサーの数を定義します。この点に関して、私は質問がありました。レデューサーは、TaskTrackerのデーモンが起動されたコンピューターでのみ実行されますか、それとも、JobTrackerとセカンダリNameNodeによって、NameNodeのどのデーモンが起動されたかを含むすべてのノードで実行されますか?私にとって、/usr/countcomputers.txt
ファイルに設定されている番号はそれに依存しているので、この質問への回答を知ることは非常に重要です。プログラムで読んでください。