8

Apache の Solr 検索エンジンは、たとえばレーベンシュタイン アルゴリズムを介して、おおよその文字列一致を提供しますか?

姓で顧客を検索する方法を探しています。ただし、名前の正確性は保証できません。「Levenstein」を検索しても「Levenshtein」という人物が見つかるように Solr を構成するにはどうすればよいですか?

4

2 に答える 2

16

通常、これは、レーベンシュタインを実装するLucene SpellCheckerをデフォルトで内部的に使用するSpellCheckComponentで行われます。

ウィキは、それがどのように機能するか、どのように構成するか、どのオプションが利用可能かを非常によく説明しています。ここで繰り返しても意味がありません.

または、 Lucene のあいまい検索演算子を使用することもできます。

もう 1 つのオプションは、レーベンシュタインの代わりに音声フィルターを使用することです。

于 2009-11-18T04:26:56.963 に答える
4

Mauricio によるすばらしい回答です。私の唯一の「安っぽい」追加は、solr への途中でファジー マッチを行うすべての用語に ~ 文字を追加することです。デフォルトの設定を使用している場合、これによりあいまい一致が得られます。

于 2009-12-02T15:07:56.390 に答える