4

あいまい検索と、逆索引付けを使用してデータベースから情報を取得する方法を研究しています。私は逆索引付けを研究しましたが、EXACT 一致でのみ機能すると思います。East Lamar Streetデータベースに文字列がある状況を想像してみてください。誰かが探していてEast Lmar Street、私は何を見つけるべきかEast Lamar Street.

Edit Distance を使用しますか?

アルゴリズムはどのように動作しますか?

データベースは逆索引付けを使用しますか?

または、フルスキャンを実行しますか?

O(1)で操作を行うためにハッシュを使用していることがわかりました。

4

1 に答える 1

2

私は、単語ごとにSoundexを使用してインデックスを作成し、フレーズ全体でレーベンシュタイン距離を使用してスコアを付ける小さなライブラリを作成しました。scala と C# のバージョンがあります。すべてのストリート名をメモリにロードする余裕がある場合は、これを使用できます。そうしないと、ソースの一部を別の方法で使用することができます。

https://github.com/rstokes/fuzzysearch

于 2013-01-19T04:15:58.433 に答える