Android アプリで文字列を音声学的に比較したい。しかし、ここでの特別なケースは、英語で書かれたインド語の単語を比較したいということです。たとえば、「Edhu」「Adhu」「Yethu」が音声的に等しいかどうかを確認したいのですが、タミル語ではすべて同じ意味です。しかし、英語のスクリプトを使用してインドの言語を書く人は、異なるスペルを使用して単語を作成します. この場合、どのように単語を比較しますか?
レーベンシュタインを試しました。しかし、返された数値を等号に変換する方法がわかりません。
Soundex を試してみましたが、単語の最初の文字が変わると、Soundex コードは同じではありません。しかし、似たような音の部分を見つけ出すことはできます。仕組みがわかりません。
soundex.encode("Yethu") (soundex.encode("Edhu")) (soundex.encode("adhu"))
Y300 E300 A300