0

SOLR 3.5 テキスト フィールド タイプでは、StopFilterFactory が PorterStemFilterFactory の前にリストされます。

これは、たとえば「ゲーム」と「ゲーム」を停止したい場合、両方をストップワードに追加する必要があるということですか?

その場合、PorterStemFilterFactory の後に StopFilterFactory を移動し、ストップワードに「game」だけを追加すると、「game」と「games」の両方が削除されますか?

本当の質問は、これを行うための最良の方法は何ですか、そして単語のすべてのバリエーションをストップワードに追加する必要があるのでしょうか?

4

1 に答える 1

2

PorterStemFilterFactoryアグレッシブなステミングを提供し、ストップ ワード フィルタの前に is があると、停止しようとしているルートとルートが異なる可能性があるため、適切なストップ ワードの削除が行われない可能性があります。ストップ ワード フィルターの前に
使用できる複数形のみの処理を追加できます。 これは複数形を処理し、ストップ ワードは単数形のみを処理する必要があります。 その後、PorterStemFilterFactory フィルターを追加して、適切なステミングを処理できます。solr.EnglishMinimalStemFilterFactory

于 2013-06-12T10:19:34.970 に答える