17

たとえば、Soundex アルゴリズムは英語用に最適化されています。大規模な言語ファミリーに適用される、より普遍的なアルゴリズムはありますか?

4

1 に答える 1

16

SOUNDEX は確かに英語指向です。さまざまな音声上の違いを考慮に入れている他の 2 つは、Double MetaphoneNYSIISです。

それらは、SOUNDEX よりもはるかに大きな可能なスペースにエンコーディングを生成します。具体的には、Double Metaphone には、英語よりも多くの言語に基づく別の発音を処理するという明確な目的を伴う削減が含まれています。

最近、あいまい文字列マッチングに関するプレゼンテーションを行いました。スライドが参考になるかもしれません。

于 2008-09-24T15:51:59.097 に答える