Web サイトをホストしている Windows Azure (Iaas) 上に多数の VM があります。多数の負荷分散されたフロントエンド VM があり、すべてが SQL Express を使用して単一の VM に接続されています。それはうまくいきます。
でも!
すべての VM でランダムに再起動します。フロントエンド VM (IIS を使用) については、負荷が分散されているため、サイトは影響を受けず、それに応じてロード バランサーが調整されます。ただし、データベースをホストしている VM が再起動されると、DB が再び稼働するまでサイトはダウンします。起動するのに 3 分未満かかりますが、それでも頻繁に発生する場合は許容できません。再起動は比較的まれですが (VM ごとに月に 2 回)、VM ごとに 1 週間に 4 回の再起動が発生することがあります。すべての VM が頻繁に再起動するわけではなく、パターンを把握できません。再起動も予期しないものです (電源ケーブルを抜くタイプの再起動であり、シャットダウンではありません)。データセンターは西ヨーロッパです。
Microsoft は、SLA が可用性セット内の 2 つの VM のみをカバーしていることを強調していますが、これはデータベース VM には適用できません (また、エンタープライズ SQL エディションには 1 アームと 3 レッグの費用がかかります)。また、SQL Azure はオプションではありません。アプリケーションは非常におしゃべりであり、SQL Azure データベースはピーク時に調整されていました (ただし、中規模の VM で SQL Express を使用すると非常にスムーズに動作します!)。
私の質問: これほど多くの再起動があるのは正常ですか? 同じ問題を抱えている他の人はいますか?Azure 上のそのような環境での経験は何ですか? このダウンタイムを最小限に抑えるにはどうすればよいですか?
皆さんありがとう!