0

Lucene.NET を使用して SpellChecker のセットアップを取得しようとしていますが、次のような状況以外はすべて正常に動作します。

インデックスにサテライトを含むテキストがあり、Snowball を使用して分析します。

次に、SpellChecker インデックスを作成し、そこから候補を取得します。「Satalite」を渡したときに返される提案は「satellit」です。

これは、Snowball が Satellite を satellit にステッピングし、SpellChecker がそれを提案として返しているためだと思います。

スペルチェッカーがそれをチェックできるように、ステム化されていない単語用の追加フィールドを作成する以外に、この2つを一緒に使用できるようにする方法はありますか?

4

2 に答える 2

0

シャシカントが上で述べたように:

そうです、これはステミングが原因で発生します。残念ながら、語幹を付けた単語は検索だけを目的としたものではなく、検索以外では意味をなさない可能性があります。複数回保存する以外のテクニックは私も知りません。その追加フィールドは、負担を軽減するために、できるだけ少ない情報を格納するように構成できます。– Shashikant Kore 12 月 2 日 14:08

于 2009-12-29T14:45:51.480 に答える
0

Snowball フィルターによって生成された単語を類義語として入れることを検討しましたか? それは私が行く方向です...それがどれほどうまくいくかはわかりませんが、もっともらしいようです. その後、スペルチェッカーは正しい単語を返しますが、それでも検索を実行して、語幹のあるバリアントを見つけることができます。

于 2011-02-13T23:35:33.853 に答える