0

Solr で Porter から KStem へのステミング フィルターの切り替えを評価しようとしています。direct_conflations.txt ファイルやその他のファイルを介して KStem を構成する機能への参照を参照していますが、このファイルをどのようにフォーマットする必要があるか、または KStem にこの構成ファイルをロードするように指示する方法に関するドキュメントを見つけることができないようです。

KStem をロードする schema.xml の solr 構成の例を次に示します。

<analyzer type="query">
  <tokenizer class="solr.StandardTokenizerFactory"/>
    <filter class="solr.StandardFilterFactory"/>
    <filter class="solr.LowerCaseFilterFactory"/>
    <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="false"/>
    <filter class="solr.KStemFilterFactory"/>
</analyzer>

Porter を使用すると、保護された単語を次のように構成できます。

<filter class="solr.EnglishPorterFilterFactory" protected="protwords.txt"/>

KStemを構成するための同等の方法があるかどうか疑問に思っています.誰かが知っているか、これがどこに文書化されているか知っていますか?

4

1 に答える 1

1

あなたの親友はsolrのソースコードを見ています。ざっと見てみると、EnglishPorterFilterFactoryとは異なり、KStemFilterFactoryは保護されたトークンリストを検索しないことがわかりました。HTH。

于 2012-06-21T20:16:50.473 に答える