App Engineで実行しているシンプルなアプリがありますが、レイテンシーに関して奇妙な問題が発生しています。これはPython2.7アプリであり、読み込み要求には1.5〜10秒かかります(GAEの感じ方によって異なります)。これは現在トラフィックの少ないサイトであるため、以前はGAEはアイドル状態のインスタンスがなく、ほとんどのリクエストがリクエストを読み込んでいたため、最初のページビューでの待機時間が長くなりました。
アイドル状態のインスタンスの最小数を「1」に設定して、これらのまれなページビューがすぐにウォームインスタンスに到達するようにしました。
ただし、1つのインスタンスが未使用のままであっても、GAEが着信要求をロード中のインスタンスにルーティングし、ウォームインスタンスはそのままにしておくケースをいくつか見てきました。
どうすればこれを防ぐことができますか?私は確かにこの振る舞いを期待していないので、私は何か間違ったことを理解しているに違いないと感じています。
更新:また、これをさらに理解しにくくしているのは、アプリでスレッドセーフが有効になっていることです。そのため、GAEが慌てて、単一の1つのリクエストに対してインスタンスを起動する理由がよくわかりません。