FAST ESP サーバーで検索アプリケーションを実行しています。今、私は文字の正規化でこの問題を抱えています。
欲しいのは「wurth」で検索して「würth」でヒットすることです。
私はesp/etc/tokenizer/tokenization.xmlで以下を設定しようとしました
<normalizationlist name="German to Norwegian">
<normalization description="German u with diaeresis, to Norwegian u">
<input>x75</input>
<output>xFC</output>
<output>x75</output>
</normalization>
</normalizationlist>
しかしもちろん、これはすべての u を ü に変換しますが、これは役に立ちません。
これを正しい方法で構成するにはどうすればよいですか?