私は分析するための雑多なデータの品揃えを与えられ、窮地に立たされています。データ型の一意でない識別子を持つ最大200万行のテーブルがありますvarchar(50)
。この識別子はに固有personID
です。このジャンクを正規化する必要がある方法を正確に理解するまで、今すぐ役立つ可能性のある別の質問があります。varchar(25)
たとえば、データ型をに変更すると、クエリが非結合で結合されたときにクエリの実行が速くなります。 PKフィールド?文字列内のすべての文字は整数ですが、それらをintに変換しようとすると、オーバーフローが発生します。または、クエリの一部をより高速に実行するために、当面の間、何らかの方法で列にインデックスを付けることができますか?
編集:personID
は、人に関する人口統計情報を含む別のテーブルへの外部キーになります。