0

友達、

現在、KStemmer を使用して、solr で開発したアプリケーションでステミング操作を実行しています。kStemmer を使用すると、protwords.txt が取得されないことがわかります。

<analyzer type="query">
    <tokenizer class="solr.StandardTokenizerFactory"/>
    <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
    <filter class="solr.StopFilterFactory"
            ignoreCase="true"
            words="stopwords.txt"
            enablePositionIncrements="true"
            />
    <filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.EnglishPossessiveFilterFactory"/>
    <filter class="solr.KStemFilterFactory" protected="protwords.txt"/>

  </analyzer>

プロトワード内の単語を保護されているとは見なしていません。これがKstemの仕組みですか?

4

1 に答える 1

1

ソースコードを確認しましたが、実装が見えませんでした。ちなみに、Solr 3.6 のソースコードを確認しました。

SnowballPorterFilterFactoryに実装されていますが、 KStemFilterFactoryには実装されていません。

于 2012-10-03T11:54:18.720 に答える