java - ドイツ語の 'ue' -> Lucene での 'u' 変換

翻译自：https://stackoverflow.com/questions/13451276 2012-11-19T09:51:31.360

1478 次

1

Lucene でのドイツ語のウムラウトの処理に関して 2 つの質問があります。

「ue」、「ae」などと書かれたドイツ語のウムラウト文字を、「u」、「a」などの折りたたみ形式に変換する方法を見つけようとしています。これは、GermanAnalyzer (およびそれによって使用される German2StemFilter) によって行われますが、残念ながら、私の場合は非常に望ましくないステミングも行います。'ue' -> 'u' 変換のみを実行できる他のフィルターはありますか?
'ü' -> 'ue' (ASCIIFoldingFilter のような 'u' ではない) 変換を行うフィルタはありますか? 私が達成しようとしているのは、ユーザーが「 über」または「ueber」を検索するたびに「über」という単語がインデックスに表示され、「uber」は検索されないことです。

2 に答える 2

2

MappingCharFilterFactoryを使用して、'ü' -> 'ue' のように、好きなことを選択できる独自のマッピングファイルを提供できます。

于 2012-11-20T08:15:28.820 に答える