クラウドでホストされる Web サービスの開発を開始していますが、一般的なクラウド SLA が提供するよりも高い可用性が必要です。
Windows Azure などの一般的な SLA では、99.9% の可用性、つまり 1 か月あたり最大 43 分のダウンタイムが約束されています。桁違いに優れた可用性 (1 か月あたり 5 分未満のダウンタイム) を探しています。問題のその部分を解決するためにいくつかの負荷分散されたデータベース バックエンドを構成できますが、Web サーバーにボトルネックが見られます。Web サーバーに障害が発生すると、顧客はサービス全体を利用できなくなります。別の単一障害点を導入することなく、そのリスクを軽減するオプションは何ですか? それぞれに次の解決策と欠点があります。
SRV レコード: インフラストラクチャ全体を複製し (データベースが同期していることに注意してください)、ドメインの SRV レコードを追加して、www.example.com にアクセスしようとしているユーザーが自動的に example.cloud1.com に転送されるようにします。または、それが example.cloud2.com に対してオフラインの場合。グーグルで調べてみると、SRV レコードはどの主要ブラウザでもサポートされていないようですが、本当ですか?
2 番目の A レコード: 代替として追加の A レコードを追加します。欠点: a) 私のホスティング プロバイダーでは、2 つ目の A レコードを追加する可能性は見当たりませんが、1 つだけです...それは正常ですか? b) 2 つのサーバーのうち 1 つのサーバーがダウンした場合、ユーザーが自動的に別のサーバーにリダイレクトされるのか、それとも全ユーザーの 50% が 404 またはその他のエラーを受け取るのかがわかりません。
ベストプラクティスの手がかりをいただければ幸いです
乾杯、セバスチャン