これは古い質問であることは承知していますが、Amazon EMR でのブートストラップ時間を短縮することを期待してこのスレッドを見つけた次の検索者に追加するいくつかの洞察がありました。
しばらくの間、クラスターの起動になぜこれほど時間がかかるのか疑問に思っていました。通常は約 15 分です。通常は 1 時間以内に完了するジョブの場合、これにはかなりの時間がかかります。ジョブが 1 時間以上かかることもありますが、幸いなことに、AWS は完全なブート ストラップ時間に対して料金を請求しないと思います。
ここ数日、起動時間が改善されていることに気付きました。4 月と 5 月の第 1 週にスポット市場が非常に不安定になったことがわかります。通常、クラスター全体をスポット インスタンスで開始します。失敗はオプションであり、私の場合はコスト削減によりこの手法が正当化されます。ただし、クラスターが開始するまで 14 時間待った後、オンデマンドに切り替える必要がありました。OnDemand クラスターは約 5 分で開始します。狂気が和らいだように見えるのでスポットに戻ったので、クラスターの15分に戻りました。
そのため、コア ノードまたはマスター ノードでスポット インスタンスを使用している場合は、起動時間が長くなることが予想されます。コアで OnDemand の小さなセットを使用して実験し、多数のスポット インスタンスを追加して、スタートアップに役立ち、スポット マーケットのボラティリティをより適切に処理できるかどうかを確認します。