0

この記事によると、すべてのクラスターには独自のストレージがあります。

" クラスターは何百万ものユーザー (ハードウェアの使用年数によって異なります) をホストし、以下を含む自己完結型のサーバーのセットです。 フロントエンド サーバー– ウイルスをチェックし、ブラウザーまたはメール クライアントと対話するコードをホストするサーバー、POP3 や DeltaSync などのプロトコルを使用 バックエンド サーバー– SQL およびファイル ストレージ サーバー、スパム フィルター、監視データおよびスパム データのストレージ、ディレクトリ エージェント、および受信メールと送信メールを処理するサーバー ロード バランサー– 負荷を分散するために使用されるハードウェアとソフトウェアパフォーマンスを高速化するために、より均等に。

ユーザーがどのクラスターに割り当てられるかは、地理 (IP アドレス) によって決まると推測しています。その場合、ドイツから自分に電子メールを送信し、米国に来たときに電子メールを確認すると、別のクラスター (したがって別の SQL データベース) に割り当てられます。米国でその電子メールを確認できるということは、すべてのクラスター内のすべてのデータベースが常に同期されているということですか?

4

1 に答える 1

1

地理的な理由は、クラスターがどのように割り当てられているかによる可能性が最も高いです (コンテンツ配信ネットワークのようなものだと考えてください)。あなたはその仮定で正しいと思います。

もちろん、これがどのように機能するかは断言できませんが、他の大規模プロバイダーでの経験から、次のように考えています。

電子メールはクラスター内に重複して保存されるため (マシン/ハード ドライブの損失は意味がありません)、これらのクラスターは (おそらく) 地理的に離れた場所に冗長的に保存されるため、大規模な停止や災害によるエンド ユーザーへの影響が少なくなります。 . このプッシュ/プルは、 n レベルの冗長性を確保するために、データ クラスター ( HDFSのようなファイル システムを考えてください) 内で常に行われています。特定の時間内に別のクラスターのシステムにログインする可能性は最小限であるため、(可用性の観点から) リアルタイムで情報を同期する必要はあまりありませんが、おそらく数分/時間のオーダーになります。 、データの耐久性を確保するためにマシンを実行できる限り高速にします。

クラスターのセットアップは、おそらく Amazon に似ています。東/西海岸クラスター、ユーロ クラスター、および他の多くのユーザーがいる場所に応じて、アジア クラスター (または 2 つまたは 3 つ) です。これらの間のデータのプッシュ プルは、数分単位ではなく、おそらく数時間単位です。

この冗長性と同期のすべては、記事で言及した記事のように、skydrive やメッセンジャーなどのすべてのサービスがこの sayme インフラストラクチャを共有していることに留意することが重要です。

于 2012-06-26T06:08:05.823 に答える