Google App Engine のアイドル状態のインスタンスが新しいリクエストを処理するために何もしないことに驚きましたが、動的インスタンスはそれらのほとんどを処理しました。多くのアイドル状態のインスタンスは、実際には数分間アイドル状態になっています.ログを確認しても、何も残っていません。
これが私のアプリケーション設定です。
動的インスタンスがアイドル状態のインスタンスよりも多くスケジュールされるのはなぜですか? 設定を改善するにはどうすればよいですか?
Google App Engine のアイドル状態のインスタンスが新しいリクエストを処理するために何もしないことに驚きましたが、動的インスタンスはそれらのほとんどを処理しました。多くのアイドル状態のインスタンスは、実際には数分間アイドル状態になっています.ログを確認しても、何も残っていません。
これが私のアプリケーション設定です。
動的インスタンスがアイドル状態のインスタンスよりも多くスケジュールされるのはなぜですか? 設定を改善するにはどうすればよいですか?
アイドル インスタンスは「予約」インスタンスであるため、トラフィックが増加するとすぐに使用できるようになります。これはドキュメントが言うことです:Idle Instances are pre-loaded with your application code, so when a new Instance is needed, it can serve traffic immediately.
したがって、大きなトラフィック スパイクが予想される場合にのみ、アイドル状態のインスタンスを多数用意する必要がありますが、同じレイテンシを維持したい場合にのみ必要です。
計算は次のとおりです。インスタンスは (最大で) 10 リクエスト/秒を処理でき、スピンアップするのに 15 秒かかります。したがって、15 秒以内に 10 リクエスト/秒のトラフィック増加が予想される場合は、アイドル状態のインスタンスが 1 つだけ必要です。30 リクエスト/秒の増加の場合は 2 つ必要です。