1

私は自分のサイトに実装するためにLucene.Netを自分自身に教えようとしています。1つの問題を除いて、必要なほとんどすべてのことを行う方法を理解しています。検索文字列内のすべての検索語をあいまい検索できるようにする方法を見つけようとしています。

たとえば、文字列が含まれるドキュメントがある場合、それを一致さThe big red foxせようとしています。bag fix

~問題は、あいまい検索を実行するために、ユーザーが入力するすべての検索用語に追加する必要があるようです。私はこれについて行くための最良の方法がわかりません。今私はこれを試みています

string queryString = "bag rad";
queryString = queryString.Replace("~", string.Empty).Replace(" ", "~ ") + "~";

最初の置換は、検索文字列にすでに例外がある場合にLucene.Netが例外をスローするためであり~、明らかに~~フレーズで処理できません。この方法は機能しますが、ファジーウェイト値を追加し始めると面倒になるようです。

あいまいさを許容するためにすべての単語をデフォルトにするより良い方法はありますか?

4

1 に答える 1

1

文書を 2 グラムまたは 3 グラムとして索引付けしたい場合があります。CJKAnalyzerを見て、その方法を確認してください。ソースをダウンロードして、ソースを確認してください。

于 2011-05-07T07:22:53.137 に答える