Solrで多言語ステミングを機能させようとしています。LangDetectLanguageIdentifierUpdateProcessorFactory
公式のSolrガイドに従って、言語検出をセットアップしました。言語が認識され、次のような動的フィールドがたくさんあります。
- 説明_en
- description_de
- description_fr
- ...
これは適切にステミングされています。
ここで問題になるのは、非常に多くのフィールドをどのように検索するかということです。可能な数十の言語フィールドを検索するたびに長いクエリを作成することは、賢明な選択肢とは思えません。私はcopyField
次のように使用してみました:
<copyField source="description_*" dest="text"/>
text
しかし、私がそうすると、フィールドでステミングが失われます。
フィールドはのようにtext
定義されsolr.TextField
ますsolr.WhitespaceTokenizerFactory
。text
フィールドを適切に設定していない可能性がありますか、それともどのように設定すればよいですか?