php - ポルトガル語のローカライズ (ダブル) Metaphone (pt_PT)

Question

英語以外の 2 つの文字列が音声的にどのように類似しているかを確認したいのですが、私の知る限り、soundexとmetaphone の実装は、英語ベースの文字列に対してのみ正しく機能します。たとえば、ポルトガル語ではまったく同じように聞こえcoraçãoますcorassãometaphone()が、とが返さKRれKRSます。他の音素でも同じことが起こり、chitaとxitaが返さXTれSTますが、同じように聞こえます。

このDouble Metaphone の実装( demo )も試しましたが、結果はまったく同じです。

それで、ポルトガル語の単語で動作する代替アルゴリズムはありますか? この他の質問でLuceneについて読んだことがありますが、これまで使用したことがなく、どのように機能するか、またはどのように使用するかわかりません。

そうでない場合、メタフォンのようなアルゴリズムを開発するために収集する必要があるデータの種類を誰か知っていますか?

score 2 · Accepted Answer

誰かが興味を持っている場合に備えて、私は有望な進行中の作業をここで見つけました。他のいくつかのクールなプロジェクト.

php - ポルトガル語のローカライズ (ダブル) Metaphone (pt_PT)

1 に答える 1

Related

Reference