0

Elastic Map reduce サンプル アプリケーション「Apache Log Processing」を実行しました。

デフォルト: デフォルト構成 (2 つの小規模コア インスタンス) で実行した場合、19 分かかりました

スケールアウト: 次に、次の構成で実行しました: 8 つの小さなサイズのコア インスタンス - 18 分かかりました

スケールアップ: 次に、次の構成で実行しました: 2 つの大きなサイズのコア インスタンス - 14 分かかりました。

より大きなデータセットがある場合のスケールアップとスケールアウトのパフォーマンスについてどう思いますか?

ありがとう。

4

1 に答える 1

0

依存していると言えます。通常、m1.large および m1.xlarge インスタンスを使用すると、生の処理速度が大幅に向上することがわかりました。それ以外は、お気付きのように、同じジョブはおそらく同じ償却または正規化されたインスタンス時間で完了します。

ジョブの場合、最初は小さなサンプル データ セットを使用して実験し、所要時間を確認してから、大きなデータ セットを使用して完全なジョブが完了するまでにかかる時間を見積もることができます。それが、ジョブの完了時間を見積もる最良の方法であることがわかりました。

于 2012-05-22T15:22:05.513 に答える