StandardAnalyzer
を使用すると、私の Lucene には数値用語も含まれています (つまり、「200」)。そのため、インデックス内の用語の数が多すぎます。
数値用語を破棄するアナライザーまたはトークナイザーが存在するかどうかは誰にもわかりませんか?
そうでない場合、簡単に手に入れる方法はありますか?
1 に答える
3
アントニオさん、SimpleAnalyzerを試してみることをお勧めします。
これがうまくいかない場合は、独自のアナライザーを作成する必要がある場合があります。
于 2011-02-03T20:59:13.400 に答える