クラウド サービスを効果的にスケーリングするための適切な構成を特定するのに苦労しています。管理ポータルのスケール セクションを使用するだけで、プログラム的には何も使用しないと思いますか? Web ロールの現在の構成は
中規模の VM (4 GB RAM) 自動スケーリング - CPUインスタンスの範囲 - 1 ~ 10ターゲット CPU - 50 ~ 80一度に 1 つのインスタンスずつスケールアップおよびスケールダウンするスケールアップおよびダウンの待機時間 - 5 分
http://loader.io/サイトを使用して、並行リクエストを API に送信することで負荷テストを行いました。また、50 ~ 100 人のユーザーしかサポートできませんでした。その後、タイムアウト(10秒)エラーが発生しました。私のアプリは何百万人ものユーザーを大規模にターゲットにする予定なので、サーバーの負荷に対応するために効率的にスケーリングする方法がよくわかりません。
問題は 5 分 (非常に高いと思います) のスケールアップ時間である可能性があると思います。管理ポータルでは、最低のオプションは 5 分なので、どうすればそれを短縮できますか?
助言がありますか?