ユーザーは、会社名を含む大きな文字列をカット アンド ペーストしてインポートします。
会社名の既存の MYSQL データベースがあり、それぞれに一意の company_id があります。
文字列を解析して、ユーザーが入力した会社名のそれぞれにあいまい一致を割り当てられるようにしたいと考えています。
現在、単純な文字列マッチを行うだけでも遅いです。** Soundex のインデックス作成は高速になりますか? ユーザーが入力しているときに、ユーザーにいくつかのオプションを与えるにはどうすればよいですか? **
たとえば、誰かが次のように書いています。
マイクロソフト -> マイクロソフト ベアエッセンシャル -> ベアエッセンシャル ポリコム株式会社 -> ポリコム
この質問に似ていると思われる次のスレッドを見つけましたが、投稿者は承認しておらず、それらのユースケースが適用可能かどうかはわかりません: