0

私のマシンでは 2 つのバージョンの solr が動作しています。と言っSolrVer1SolrVer2

SolrVer1をフィールド タイプのステミング メソッドの下に適用しましたtext_en_splitting

<filter class="solr.KeywordMarkerFilterFactory" protected="protwords.txt" ignoreCase="true"/>
 <filter class="solr.PorterStemFilterFactory" ignoreCase="true"/>

SolrVer2をフィールド タイプのステミング メソッドの下に適用しましたtext_en_splitting

<filter class="solr.SnowballPorterFilterFactory" language="English" protected="protwords.txt"/>

通常の検索とほぼ同じように機能しますが、ワイルドカード検索を使用している間、ワイルドカード検索では文法がオンの結果が得られません SolrVer1

で検索する場合と同様に ray*SolrVer1に比べて非常に少ないデータしか返されませんSolrVer2。結果を観察したところ、と のみでSolrVer1データを返さないことがわかりました。rayrays

SnowballPorterFilterFactoryどこで使うべきか、どこで使うべきかわかりませんPorterStemFilterFactory。それらの長所と短所は何ですか?

誰でもこの動作について考えられますか??

ありがとう

4

2 に答える 2

1

のステマーが何を出力するかを知る必要がrayありraysます。

Porter Stemmer オンライン ツール ( http://qaa.ath.cx/porter_js_demo.html ) でそれらをステミングしてみてください。出力しますrairay*これが、Porter ステマーで一致するものが得られない理由です。

Snowball Stemmer のツールは次のとおりです: http://snowball.tartarus.org/demo.php。これによりray、結果が得られますrayrays

2 つのステマーを比較するには、こちらをお読みください: http://snowball.tartarus.org/texts/introduction.html

Snowball は、Porter のこのような欠点に対処するために設計されたようです。

于 2012-08-23T22:09:53.520 に答える
0

アナライザー

On wildcard and fuzzy searches, no text analysis is performed on the search word.

ウィルカード検索のクエリ時間には分析が行われないため、クエリ時間中にステマーが適用されます。
結果は、ステマーが何を生成しているかによって異なります。

于 2012-08-24T07:34:31.263 に答える