6

Web サイトをホストしている Windows Azure (Iaas) 上に多数の VM があります。多数の負荷分散されたフロントエンド VM があり、すべてが SQL Express を使用して単一の VM に接続されています。それはうまくいきます。

でも!

すべての VM でランダムに再起動します。フロントエンド VM (IIS を使用) については、負荷が分散されているため、サイトは影響を受けず、それに応じてロード バランサーが調整されます。ただし、データベースをホストしている VM が再起動されると、DB が再び稼働するまでサイトはダウンします。起動するのに 3 分未満かかりますが、それでも頻繁に発生する場合は許容できません。再起動は比較的まれですが (VM ごとに月に 2 回)、VM ごとに 1 週​​間に 4 回の再起動が発生することがあります。すべての VM が頻繁に再起動するわけではなく、パターンを把握できません。再起動も予期しないものです (電源ケーブルを抜くタイプの再起動であり、シャットダウンではありません)。データセンターは西ヨーロッパです。

Microsoft は、SLA が可用性セット内の 2 つの VM のみをカバーしていることを強調していますが、これはデータベース VM には適用できません (また、エンタープライズ SQL エディションには 1 アームと 3 レッグの費用がかかります)。また、SQL Azure はオプションではありません。アプリケーションは非常におしゃべりであり、SQL Azure データベースはピーク時に調整されていました (ただし、中規模の VM で SQL Express を使用すると非常にスムーズに動作します!)。

私の質問: これほど多くの再起動があるのは正常ですか? 同じ問題を抱えている他の人はいますか?Azure 上のそのような環境での経験は何ですか? このダウンタイムを最小限に抑えるにはどうすればよいですか?

皆さんありがとう!

4

2 に答える 2

3

再起動が多いのは普通ですか?

はい、これは特定の月に発生する可能性があります。これを実際に機能させるには、SQL Server を高可用性モードで立ち上げる必要があります。

はい、腕と脚がかかります。;(

Azure 上のそのような環境での経験は何ですか? 一部の月は非常に良い月であり、一部の月は悪い月であり、クラスターと使用しているデータセンターによって異なります。MS は、データセンター内のハードウェアの範囲を混在させています。これは、一部のデータセンターで古いラップトップで実行されているという意味ではありませんが、私の経験では、新しいデータセンターにはより優れたキットが搭載されているため、再起動が少なくなる傾向があることを意味します. つまり、USA East を使用します。

このダウンタイムを最小限に抑えるにはどうすればよいですか?

ウィットネスによる高可用性は、VM で可用性を実現する唯一の方法です。

その他の深刻なオプション。キャッシュ キャッシュ ..コンピューター キャッシュ、Azure キャッシュを使用し、データベースへの呼び出しを最小限に抑えるようにしてください。これにより、おしゃべりなアプリが減り、SQL Azure に戻ることができるようになる可能性がありますが、フェールオーバーが回復するのに十分な可能性があります。

キュー キューは、アプリケーションの復旧を支援し、ユーザーにアプリケーションに取り組んでいるというメッセージを提供します。

SQL Azure をフェールオーバーとして使用します。SQL Azure Sync を Premise から (これが Express で動作するかどうかは不明) を使用して SQL Azure にデータを同期し、接続エラーとフェールオーバーを検出するためにアプリ コードに書き込みます。

アプリの一部に Azure の他の部分を使用して、SQL に着信する呼び出しの量を減らすことを検討してください。つまり、ものをテーブル ストレージに移動できますか?

HTHS はいくつかのアイデアを提供します。

于 2013-05-09T09:59:19.280 に答える
1

Windows Azure インフラストラクチャ サービス (IaaS) は、4 月 16 日から約 3 週間しか一般提供 (GA または運用) されていません(こちらの発表を参照)。GA の前は SLA がなく、さまざまなパッチがまだホスト OS に適用されていたため、OS の再起動がより頻繁に行われていました。4 月 16 日以降、このパターンが同じ速度で続いているということですか。

IaaS が GA になった今、1 週間に 4 回の再起動は期待できません。つまり、再起動が表示される理由はいくつかあります。

  • ホストのハードウェア障害 (これにより、そのホストで実行されているすべてのゲスト OS が停止します)
  • ホスト ソフトウェアの更新 (ホスト OS の再起動が必要な場合のみ)。ホスト OS の再起動は、表示されている頻度では発生しないはずです。
  • ゲスト OS の問題。ここで、PaaS (Web/worker ロールのクラウド サービス) から出発します。IaaS では、Azure によるゲスト OS のメンテナンスはありません。これはすべてあなたの手の中にあります。Windows Update を自動的にインストールすると、再起動する可能性があります。おそらく、アプリケーション レベルの問題が発生して、ボックスが長時間応答しなくなり、その結果、Azure ファブリック コントローラーがボックスを異常であると判断して再起動する可能性があります。そして...あなたのアプリが何らかの形でボックスをクラッシュさせる可能性があります。

アプリケーション エラーを除外し、再起動時に VM が正常に動作していることを確認した場合は、Microsoft でサポート チケットを開いて問題をさらに診断する必要がある場合があります。

于 2013-05-09T11:01:03.573 に答える