1

Lucene.net アプリの重複をキャッチするスキームを考案しようとしています。私の問題は、フィールドの多くが同じであるため、一意のキーを作成するのが難しいことです。私が知っている唯一のフィールドは、タイトルと要約フィールドです。これからキーを作成する際の問題は、誰かがタイトルをわずかに変更する可能性があり、それも一意と見なされることです。基本的に、95% 一致する場合に一致するしきい値を設定する方法を探しています。Lucene でこれを行う方法はありますか?

4

1 に答える 1

1

一意のキーの要件についてはよくわかりませんが、Lucene の FuzzyQuery をチェックして、同様の条件で一致させることができます。これらの記事をチェックしてください: Fuzzy SearchesFuzzyQuery

于 2013-04-22T16:23:29.950 に答える