パラメータを設定して、Google App Engine の請求額を削減しようとしていautomatic_scaling
ます。平均して、私のアプリでは 7 ~ 10 個のインスタンスが実行されており、そのうち 2 ~ 3 個はアイドル状態です。しかし、添付のグラフの午前 3 時から午前 6 時の間のように、アクティブなインスタンスとアイドル状態のインスタンスの差がとてつもなく大きい場合があります。また、アクティブなインスタンスの数を減らして、最終ユーザーの応答時間を増やしたいと考えています (設定min_pending_latency
とmax_pending_latency
)。しかし、これまでのところ、これらの設定はどれも効果を発揮していません。
これは私の app.yaml 構成です:
automatic_scaling:
min_pending_latency: 250ms
max_pending_latency: 750ms
max_idle_instances: 2