ここ数日、soundex、metaphone、およびその他の文字列検索手法を研究してきました。私の理解では、英語以外の単語を英語に音訳した場合、両方のアルゴリズムがうまく機能します。
ただし、そのような検索が、ドイツ語、ノルウェー語、さらにはキリル文字などのアルファベットに対応する、文字変換されていない元の言語で機能する必要があります。
これらのアルファベットを完全に処理できる検索アルゴリズムはありますか? それとも、Lucene などのサードパーティの全文検索ライブラリを使用したほうがよいでしょうか? したがって、質問は「Lucene は英語以外のアルファベットを処理しますか?」になります。