0

eコマース衣料品Webサイトの検索機能にElasticSearch(Ruby、Tire経由)を使用しています。ステミング フィルターが必要ですが、ステミングされない保護された単語のリストを指定できる必要もあります。現在、ステミングにスノーボール フィルターを使用していますが、保護された単語を指定できるかどうかわかりません。他のステミング フィルターも調べました。

  • Porter Stem はステミングで攻撃的すぎるようで、奇妙な混乱を引き起こしています
  • KStem は英語のみのようで、これは多言語プロジェクト用です
  • Stemmer は Snowball に似ているが、より機能が豊富であると主張していますが、それに関する適切なドキュメントが見つかりません

私の質問は次のとおりです。スノーボールでこれらの目標を達成する方法はありますか (もしそうなら、どのように?)、または他のステミング フィルターのいずれかに切り替える必要がありますか?

4

1 に答える 1

1

キーワードマーカーフィルターを使用します。

https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-keyword-marker-tokenfilter.html

于 2012-10-12T22:06:47.153 に答える