友達、
現在、KStemmer を使用して、solr で開発したアプリケーションでステミング操作を実行しています。kStemmer を使用すると、protwords.txt が取得されないことがわかります。
<analyzer type="query">
<tokenizer class="solr.StandardTokenizerFactory"/>
<filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
<filter class="solr.StopFilterFactory"
ignoreCase="true"
words="stopwords.txt"
enablePositionIncrements="true"
/>
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.EnglishPossessiveFilterFactory"/>
<filter class="solr.KStemFilterFactory" protected="protwords.txt"/>
</analyzer>
プロトワード内の単語を保護されているとは見なしていません。これがKstemの仕組みですか?