次のデータがあるとします。
OrderNumber | CustomerName | CustomerAddress | CustomerCode
1 | Chris | 1234 Test Drive | 123
2 | Chris | 1234 Test Drive | 123
列 "CustomerName"、"CustomerAddress"、および "CustomerCode" がすべて完全に相関していることをどのように検出できますか? Sql Server のデータ マイニングはおそらくこの仕事に適したツールだと思いますが、その経験はあまりありません。
前もって感謝します。
アップデート:
「相関」とは、統計的な意味で、列 a が x のときはいつでも列 b が y になることを意味します。上記のデータでは、最後の 3 つの列は互いに相関しており、最初の列は相関していません。
操作の入力はテーブルの名前になり、出力は次のようになります。
Column 1 | Column 2 | Certainty
CustomerName | CustomerAddress | 100%
CustomerAddress | CustomerCode | 100%