Azure 自動スケーリング サービスを介して自動的にスケーリングしたいステートレス (共有 Azure Redis Cache を使用) WebApp があります。自動スケールアウトをアクティブ化すると、または WebApp の 3 つの固定インスタンスをアクティブ化しても、逆の効果が得られます。応答時間が指数関数的に増加するか、HTTP 502 エラーが発生します。
これは、構成済みのトラフィック マネージャーの URL (単一のインスタンスで数か月間正常に機能していた) を使用するか、ネイティブの URL (.azurewebsites.net) を使用するかに関係なく発生します。これは、トラフィック マネージャーと関係がありますか? もしそうなら、この組み合わせに関する情報はどこにありますか (検索した結果)? また、トラフィック マネージャーのフェールオーバー/パフォーマンスで自動スケールを適切に活用するにはどうすればよいですか? トラフィック マネージャーをフェールオーバー モードとパフォーマンス モードの両方に設定しようとしましたが、明らかな効果はありませんでした。プライベート チャネル経由で喜んでリンクを提供できます。
更新:「別の方法」で状況を再現しました: 頻繁に 5XX エラーが発生していたアカウントで、負荷分散されたすべてのサーバーを削除し (現在はアプリごとに 1 つのサーバーのみ)、問題は解消されました。もう 1 つのアカウントでは、3 台のサーバー (トラフィック マネージャーは構成されていません) 間でバランスを取るようになり、すぐに 502 と 503 のショー ストッパーが頻繁に発生しました。
ここに関連する仮説: https://ask.auth0.com/t/health-checks-response-with-500-http-status/446/8
もしかして原因?テイカーはいますか?
アップデート
すべての WebApp を単一のインスタンスに戻して負荷分散との関係を排除した後、しばらくの間は問題なく動作しました。その後、同じ「502」の動作がすべてのサーバーで約 1 秒間発生しました。2016.01.04 15分後、再び消失。
アップデート
この問題は、2016 年 1 月 8 日の 12.55 UTC/GMT に 10 分間再発し、数分後に再び消失しました。詳細については、現在ログファイルを確認しています。
アップデート
2016 年 1 月 19 日の約 11.00 UTC/GMT で、同じく .scm で問題が 90 分間再発しました。ページ。これは、"dummy1015" という名前の Web アプリを持つアカウントの "reference-client" Web アプリです。「502 - ゲートウェイまたはプロキシ サーバーとして機能しているときに、Web サーバーが無効な応答を受け取りました。」