巨大な「説明のつかない」レイテンシーは、ほとんどの場合、ウォームアップ要求がリソースを食いつぶすことです。appengineログを調べて、ウォームアップで使用されているapi_msとcpu_msの量を確認します。
appengineコントロールパネルで保留中の最大レイテンシを増やすことで、ウォームアップを回避できます。より高いレイテンシーを許可することは、新しいインスタンスを起動する前にリクエストがより長く待機することを意味します。これにより、各リクエストが少し遅くなる可能性がありますが、大量の読み込みリクエストを回避できます。
ウォームアップリクエストを支援するために、appengine-web.xmlに次のものがあることを確認してください。
<warmup-requests-enabled>true</warmup-requests-enabled>
これにより、現在のインスタンスがオーバーロードされているときに、appengineディスパッチャーが新しいインスタンスをプリエンプティブに起動します{つまり、リクエストが新しいインスタンスに送られる前にロードを開始します}。
次に、影響を受ける低速サーブレットで、web.xmlにload-on-startupを配置していることを確認してください。
<servlet>
<servlet-name>my-servlet</servlet-name>
<servlet-class>com.company.MyServlet</servlet-class>
<load-on-startup>1</load-on-startup>
</servlet>
load-on-startupは、ウォームアップ要求が終了するとすぐに、優先度の高いサーブレットが常に準備ができていることを保証するだけです。