algorithm - 英語以外の文字の soundex/metaphone を有効にする

Question

ここ数日、soundex、metaphone、およびその他の文字列検索手法を研究してきました。私の理解では、英語以外の単語を英語に音訳した場合、両方のアルゴリズムがうまく機能します。

ただし、そのような検索が、ドイツ語、ノルウェー語、さらにはキリル文字などのアルファベットに対応する、文字変換されていない元の言語で機能する必要があります。

これらのアルファベットを完全に処理できる検索アルゴリズムはありますか? それとも、Lucene などのサードパーティの全文検索ライブラリを使用したほうがよいでしょうか? したがって、質問は「Lucene は英語以外のアルファベットを処理しますか?」になります。

score 0 · Accepted Answer

ウィキペディアには、 Soundexの記事から始めて、いくつかの参考文献があります。このような多種多様な言語を処理するように設計された既存のライブラリがあるかどうかはわかりません。

2 に答える 2