プロビジョニングの時間を短縮するために、専用の EMR クラスターを 5 つのインスタンスで維持することにしました (約 5 つ必要になると予想されます)。さらに必要な場合は、何らかの自動スケーリングを実装する必要があると考えています。
EMR にはまったく詳しくありません。自動スケーリングはサポートされていますか? ドキュメントでこれを見つけました:http://docs.aws.amazon.com/ElasticMapReduce/latest/DeveloperGuide/emr-manage-resize.html
それは自動スケーリングを探す正しい場所ですか、それとも「サイズ変更」の意味を誤解していますか。EMR の利点の 1 つは「オンデマンド処理」であると読みましたが、インスタンス数を指定しなくても ec2 インスタンス間で負荷が分割されるため、ec2 インスタンスのスケーリングを独自に行っているという印象を受けます。 、つまり、自分自身を自動スケーリングする必要はありません。「オンデマンド処理」の意味を誤解していますか?
私が提供したサイズ変更リンクが私がやろうとしていることに対して適切である場合、サイズ変更のタイミングを決定した経験がある人はいますか? このドキュメントでは、サイズ変更のタイミングについてアラームを鳴らす方法などについては説明していません。通常の自動スケーリング サービスを使用しており、特定の条件に基づいてサイズを変更できますが、ここでは表示されません。
EMR の自動スケーリングが悪い考えであるかどうかはまだわかりません。(これを提供する Qubole のような企業全体が存在するため) または、EMR は必要なコンピューティング パワーを既に使用しているため、あまり役に立たないのでしょうか? EMR が実際に提供するものについてはあまり知らないので、混乱しているのかもしれません。