Soundexは一部のDBMSに実装されているようですが、Soundexの現在の実装よりも明らかに優れているアルゴリズムの改善はありますか?
3 に答える
はい。ウィキペディアが指摘しているように、メタフォンとダブルメタフォン、NYSIISなどがあります。
これらは英語でのみ機能することを覚えておいてください。英語には、正書法に特定の問題があります。スペイン語ではほとんど必要なく、中国語/北京語では意味がありません。
「間違いなく優れている」かどうかはわかりませんが、Metaphone(およびそのバリアント)とCaverphoneを確認することをお勧めします。たとえば、MYSQLで使用するための「DoubleMetaphone」の実装があるhttp://www.atomodo.com/code/double-metaphoneを参照してください。
Metaphone 3は、Metaphoneアルゴリズムの第3世代です。北米で最も一般的な英語の単語、名前、および英語以外の単語のデータベースに対してテストした場合、音声エンコーディングの精度がDouble Metaphoneの89%から98%に向上します。これにより、アメリカの発音に対して非常に信頼性の高い音声エンコーディングが生成されます。
Metaphone 3は、オリジナルのMetaphoneおよびDoubleMetaphoneアルゴリズムを設計および開発したLawrencePhilipsによって設計および開発されました。