2

この質問は重複で報告される可能性がありますが、私は多くの調査を行っており、満足のいくものは何も得られていないため、正確に質問する方がよいと考えました.

私のプロジェクトでは、アドレス文字列を一致させる必要があります。Soundex、Levenshtein 距離、Damerau-Levenshtein 距離、ファジー検索、文字頻度マッチングなど、いくつかの文字列検索アルゴリズムを既に実装しています。すべての St. を Streets に置き換えることを考えましたが、「St.」のような住所で問題が発生します。ポールズ・ストリート」。私は何をすべきか?

4

1 に答える 1

1

文字列距離ディクショナリを作成します。例: Distance('street','st')=0 . ただし、この辞書を作成するにはトレーニング データが必要です。

于 2013-05-21T18:50:00.337 に答える