非常に単純な質問がありますが、答えが見つかりませんでした。そのため、いくつかの基本的な事実が欠けている可能性が高いと思います。
私は memcache を使用して大規模な静的データをキャッシュして提供しています。これにより、通常、単一のインスタンスから何千人ものユーザーにサービスを提供できるはずです。ただし、アプリ エンジンはシングル スレッドであるため、すべてのリクエストがキューに入れられて順番に処理され、最終的に多くのユーザーにサービスを提供するときに複数のインスタンスが開始されるようです…</p>
特に新しいインスタンスを開始するときのレイテンシーは別として、これはさらに大きな価格の問題を引き起こします. Google は現在、CPU 使用率ではなくインスタンス時間に対して課金しているため、キャッシュされたデータを提供することで、各インスタンスから利用可能な CPU の一部を使用している可能性が高く、この投稿と同様に、多くの不要な追加インスタンスに対して課金されています…< /p>
何か不足していますか?
回答ありがとうございます