会社名の膨大なリストと、それらの名前に関連付けられた郵便番号の膨大なリストがあります。(>100,000)。
同様の名前を出力する必要があります (たとえば、AJAX INC と AJAX は同じ会社であり、編集距離として 4 文字のしきい値を選択しました)、対応する郵便番号も一致する場合のみです。
問題は、これらすべての会社名を辞書に登録し、郵便番号やその他の特性のリストをその辞書キーに関連付けることができることです。ただし、各ペアを一致させる必要があり、O(n^2) では永遠に時間がかかります。それを行うより速い方法はありますか?