Lucene.net アプリの重複をキャッチするスキームを考案しようとしています。私の問題は、フィールドの多くが同じであるため、一意のキーを作成するのが難しいことです。私が知っている唯一のフィールドは、タイトルと要約フィールドです。これからキーを作成する際の問題は、誰かがタイトルをわずかに変更する可能性があり、それも一意と見なされることです。基本的に、95% 一致する場合に一致するしきい値を設定する方法を探しています。Lucene でこれを行う方法はありますか?
質問する
174 次
1 に答える
1
一意のキーの要件についてはよくわかりませんが、Lucene の FuzzyQuery をチェックして、同様の条件で一致させることができます。これらの記事をチェックしてください: Fuzzy Searches、FuzzyQuery。
于 2013-04-22T16:23:29.950 に答える