これがこの質問に対する適切なフォーラムかどうかはわかりませんが、正しい方向性を示していただければ幸いです。私たちは、MySql と Solr を組み合わせて、会社の全文とクエリのニーズに対応しています。しかし、お客様の成長に伴いデータ量も増加しており、MySql は格納/クエリの適切なオプションであることが証明されていません。
Solr Cloud を見てきましたが、とても印象的ですが、ストレージ システムを譲渡する必要があるかどうかはわかりません。そのため、私は DataStax を検討してきましたが、商用オプションは論外です。そのため、hbase を使用してデータを保存し、同時にデータを Solr クラウドにインデックス付けすることを考えていましたが、多くの理由から、この設計は説得力がないようです (Lilly の基本とも見なされます)。
複数のレプリケーションを使用する Solr クラウドのみを使用することをお勧めしますか、それとも hbase-solr が適切なオプションのように思われますか
Solr Shard と Hbase ノードの両方を同じマシンに保持すると、どれだけの負荷がかかるか
- 5 億から 10 億のレコードを保存するには、どのような種類のマシン構成が必要になるか計算できますか。これらのほとんどは、ソーシャル データ (Twitter/facebook/ブログなど) とシャードの数です。
よろしく、
アユシュ