1

1,000,000 を超えるドキュメントに対して、全文検索エンジン プロバイダーとして Solr をテストしています。ドキュメントに関連するユーザー情報データも作成者として持っており、ヒットしたユーザーを保存したいと考えています。

すべてのデータを格納するためにデータベース エンジンが必要ですか? それとも、Solr は安定しており、信頼しても安全ですか? Solr に保存されたデータを失うリスクはありますか (Solr インデックスで発生する可能性があり、再構築できることはわかっていますが、RAW データはどうですか?)

2番目のストレージが必要な唯一の理由は、すべてのデータの別のバックアップ/バージョンを持っていることです(クエリ用ではありません...)。

4

1 に答える 1

2

アミール、

  1. ソルは安定しています。確信が持てない場合は、ここにあるユーザーのリストを見てください... http://wiki.apache.org/solr/PublicServersには、NASA、AT&T などが含まれます...

  2. Solrの主な目標は、検索エンジンとして機能し、検索、NLPアルゴリズム、ビッグデータの問題などの実装を支援することです.Solrはメインのデータストアになることを意図していません.

上記のあいまいな文の理由は、リレーショナル データベースとは異なり、Solr は元のデータとインデックスの両方、またはデータ自体なしでインデックスのみを格納できるためです。

Solr schema.xml でフィールドごとに Stored="false" を指定してインデックスのみを保存すると、Solr データ ボリュームがはるかに小さくなり、パフォーマンスが向上しますが、Solr にクエリを実行すると、ドキュメント ID のみが返されます。リレーショナル DB を続行する必要があります.... もちろん、データの一部、ドキュメント フィールドの一部を保存し、一部の保存を避けることができます。

もちろん、障害復旧などを確実にするために、Solr をバックアップ/複製する必要があります。

于 2013-10-16T06:02:31.897 に答える