9

Web サイトで優れた自然言語検索を実行しようとしており、Apache Solr と Xapian の利点を理解しようとしています。Xapian の方がセットアップが簡単なようです。どちらも優れた自然言語検索を提供しますか? 任意の洞察をいただければ幸いです。

4

1 に答える 1

7

Xapian は、アプリケーションに統合するライブラリである Lucene に似ています。C++ アプリを使用している場合は、Xapian の方が適している可能性があります。Java アプリケーションを使用している場合、ほぼ間違いなく Lucene が最良の選択です。

検索サーバーが必要な場合は、Omega (Xapian 上に構築) と Solr (Lucene 上に構築) を比較してください。私は Omega や Xapian を使用したことはありませんが、Solr には、特にフィールドごとの分析チェーンなど、私が依存するようになったいくつかの機能があります。これは素晴らしいアイデアであり、Ultraseek に取り組んでいたときに思いつきたかったものです。

独自の Java クラスを使用して Solr 分析チェーンを拡張するのは非常に簡単です。Omega/Xapian を使用する C++ では、これはより困難になると思います。

2 つのエンジンは、異なる基本的な関連性モデルを使用します。Xapian は確率的エンジンであり、Lucene はベクトル空間エンジンです。両方のモデルがうまく機能するように調整されているのを見たので、それが決定する理由ではないかもしれません.

Solr/Lucene コミュニティは大きく、非常に役に立ちます。

于 2012-04-11T21:35:37.937 に答える