cfg 情報を一元化することを考えており、zookeeper が適切な選択のようです。また、シャーディングにも関心があり、スキームがあります。poweredBy[1] では、Rackspace と Yahoo がシャーディングに Zookeeper を使用していることを確認しました。ポインタと詳細をいただければ幸いです。
[1] https://cwiki.apache.org/confluence/display/ZOOKEEPER/PoweredBy
cfg 情報を一元化することを考えており、zookeeper が適切な選択のようです。また、シャーディングにも関心があり、スキームがあります。poweredBy[1] では、Rackspace と Yahoo がシャーディングに Zookeeper を使用していることを確認しました。ポインタと詳細をいただければ幸いです。
[1] https://cwiki.apache.org/confluence/display/ZOOKEEPER/PoweredBy
彼らが参照している可能性のある 2 つのことを考えることができます。
組み込みのアンサンブル機能を使用して参照している可能性があります。これらを使用して、サービスのグループ管理プロトコルを実際にセットアップできます。アンサンブルにサーバーを追加すると、プールをより多くの数に効果的に分割できます。アンサンブルのメンバー間のデータは、メンバー サーバー間で同期されます。これは、同じデータ セットを複数の読み取りプール (インデックス サーバー、検索サーバー、読み取りキャッシュなど) に分割するアプリケーションで特に役立ちます。
構成管理に ZooKeeper を使用している可能性があります。ここで、アプリケーションに何千ものクライアントがあり、それらすべてが同時に構成ファイルを更新する必要があると仮定しましょう。アプリケーションが 50 台のサーバーのデータ ストレージ レイヤーにアクセスするとします。ただし、そのプールは 200 台に分割する必要があります。スレーブ関係をセットアップして、1 対 4 のスレーブ関係を実行できます。その後、ZooKeeper を使用してその構成ファイルを更新し、本質的にすべての構成ファイルを 1 秒以内に変更することができます。
Solr は、シャーディングに Zookeeper を使用します。ZooKeeper 統合設計ドキュメントは興味深いかもしれません。
また、HBase が Zookeeper をどのように使用するかについても確認する必要があります。特に地域に関する情報を維持するために。これは、ZK を使用して DB シャーディング情報を維持することに似ています。