50 ノードのクラスターがあり、各ノードには計算用に 8 つのコアがあります。200 個のレデューサーを課す予定のジョブがある場合、パフォーマンスを向上させるための適切な計算リソース割り当て戦略は何でしょうか?
つまり、それぞれに 50 ノードと 4 コアを割り当てるのと、それぞれに 25 ノードと 8 コアを割り当てるのとではどちらがよいのでしょうか? どのような場合にどちらが良いですか?
50 ノードのクラスターがあり、各ノードには計算用に 8 つのコアがあります。200 個のレデューサーを課す予定のジョブがある場合、パフォーマンスを向上させるための適切な計算リソース割り当て戦略は何でしょうか?
つまり、それぞれに 50 ノードと 4 コアを割り当てるのと、それぞれに 25 ノードと 8 コアを割り当てるのとではどちらがよいのでしょうか? どのような場合にどちらが良いですか?
あなたの質問に答えるために、それはいくつかのことに依存します。私の意見では、一般的には 50 ノードの方が優れています。
ただし、主な関心事がネットワークである場合は、50 ノードを使用することのいくつかの欠点を次に示します。
これらのネットワークの問題があっても、ノードの価値はコアの数だけではないという理由だけで、50 ノードの方が優れていることがわかると思います。ほとんどの場合、ディスクの数を考慮する必要があります。
言うのは難しいですが、通常は常に「高ければ高いほど良い」です。障害を防ぐためには、より多くのマシンが必要です。
通常、Hadoop はコモディティ ハードウェアで問題なく、サーバーごとに 50 個の 4 コアを選択できます。
しかし、優れたハードウェア、より高い CPU 周波数、DDR3 RAM、または 10k rpm ディスクを備えている場合は、8 コアを選択します。