結果のリアルタイムのインデックス作成を必要とするサイト ATM を構築しています (1 秒あたり 10,000 ドキュメントではなく、ミリ秒単位の更新を意味します)。私はさまざまな技術を調査し、当初は数十の異なるプラットフォームを思いつきました。控除を使用して、選択肢を約 3 つに絞り込むことができました (ドキュメントの複雑さ、さまざまな種類のサポートなど)。
- ルーセンス
- ザピアン
- スフィンクス
私は当初、それらを使用しているサイトによってこれらのいずれかを選択しようとしましたが、驚いたことに、非常に多くの知名度の高いサイトがこれら 3 つすべてを信頼しています。また、これら 3 つすべてでミリ秒単位の更新が可能であることもわかりました。
私が最初に Sphinx について考えたのは、3 つの中で唯一、ほぼリアルタイムのインデックス作成ではなく完全なリアルタイムのインデックス作成と言って、まだベータ版であることがわかったからです (この技術がリアルタイムのインデックス作成でどれほど信頼できるかはわかりません)。
solr がリアルタイムのインデックス作成を取得すると、スキーマを solr に移動するのが非常に簡単になるため、私は lucene に傾倒しています。
また、私が知っている多くのサイトが Xapian をうまく実装しているため、Xapian に傾倒しています。
これらの技術と、どれが最も適しているかを決定するのに大きな問題があります。
私は、リアルタイムで追加/削除/更新できるインデックスを必要とする数百万、場合によっては数千万のレコードを持つサイトを見ています。
リアルタイム検索プラットフォームを使用した経験を共有して、自分に適したプラットフォームを選択するのに役立つ人はいますか? 私はここにない提案を受け入れます:)。
PS私はMongoDBを使用しているので、SQLのみの検索プラットフォームを投稿しないでください:)。