synchronization - クラウドベースの同期アーキテクチャ

Question

クラウドベースの同期ソリューション (Dropbox のようなもの) を構築することを考えています。

堅牢なアーキテクチャとはどのようなものでしょうか?
Windows、Mac、Linux、モバイルデバイスなどのさまざまなプラットフォームをサポートするには、どのようなテクノロジが必要ですか?
どの効率的な同期アルゴリズムを使用しますか?

私は単純なアーキテクチャ/ソリューションが次のようになることを知っています:

クラウドストレージへのネットワーク呼び出しを行い、同期フォルダーツリー構造 (メタデータ情報のみ) を取得します。
クライアントにファイルシステムモニターを配置して、ローカル同期フォルダーツリー構造を構築します (ファイルシステムモニターには lsyncd などを使用すると思いますか?)
前回の同期から同期フォルダー構造を取得します。これで、クライアントに 3 つのフォルダーツリー構造ができました。これら 3 つのツリーを使用して、ローカルフォルダーで実行する必要があることと、サーバーのリモートフォルダーで実行する必要があることを判断できます。たとえば、アプリケーション固有の事前定義されたルールを使用して、追加、削除、編集、競合解決などを行います。

このアーキテクチャで十分かもしれませんが、問題は細部にあります。同期フォルダツリーが非常に大きい (つまり、非常に広くて深い) 場合はどうなりますか。差分を決定するための効率的なアルゴリズムが必要であることは明らかです。ネットワーク接続が切断され、ツリー全体を適切に取得または送信できなかった場合はどうなりますか? また、ネットワークペイロードなどを減らすために、ファイルの差分のみを送信します。

これらは私が設計したものであることは承知していますが、私の質問は、このアーキテクチャで十分かどうか、詳細に時間を費やすべきかどうかです。Dropbox はどのように設計されており、大きなフォルダ構造とデータサイズの同期を非常に効率的にするために、どのような技術とアルゴリズムを使用していますか? このようなものを設計する際に参照できるリソース/書籍はありますか?

前もって感謝します。

score 1 · Accepted Answer

まず、 Dropbox APIを評価して、 DropboxAPIをどのように設計したかについてのアイデアを得るのがよいでしょう。これにより、テクニックをソリューションにどのように適合させることができるかについてのアイデアが得られる可能性があります。他の同期ソリューションと同様に、悪魔は細部に宿っています。

-明細書

synchronization - クラウドベースの同期アーキテクチャ

1 に答える 1

Related

Reference