私は汚れたデータベースを持っており、最初に住所から都市名を抽出し(いくつかのバリエーションで書かれています)、都市名のスペルを標準化し、すべてのデータを標準化された都市名に置き換えることにより、それをきれいにする必要があります
Cities_look up テーブルを作成しました。可能なすべての都市名のバリエーションが書かれているこのテーブルには、たとえば2つの列があります
Standard_City_Name Dirty_City Name
NEW YORK NEW
NEW YORK NY
NEW YORK newyork
NEW YORK New york
NEW YORK ny
NEW YORK NWYK
今度は、このテーブルを検索して、Dirty_City_Name 列のすべての値を比較し、それをトリミングして、住所から都市名をトリミングする必要があります。次に、都市の新しい列を作成し、そこにStandard_City_Nameを書き込みます
私はこれをやっています
SELECT TRIM(TRIM(TRAILING Cities_lookup.Dirty_City_Name FROM Address) ), Cities_lookup.Dirty_City_Name
from Student left join Cities_lookup
on Student.Address like CONCAT('% ',Cities_lookup.Dirty_City_Name)
誰でも助けることができますか?