これは、2 つの数値を結び付ける私のデータ (n>3000) のサンプルです。
id a b
1 7028344 7181310
2 7030342 7030344
3 7030354 7030353
4 7030343 7030345
5 7030344 7030342
6 7030364 7008059
7 7030659 7066051
8 7030345 7030343
9 7031815 7045692
10 7032644 7102337
問題は、id=2 が id=5 の複製であり、id=4 が id=8 の複製であることです。a
そのため、 columnを columnにマップする if-then ステートメントを作成しようとするとb
、基本的に数値が入れ替わってしまいます。私の完全なデータでは、このようなケースがたくさんあります。
したがって、私の質問は、重複を特定し、何らかの方法で重複の 1 つ (id=2 または id=5) を削除することです。できれば Excel でこれを行いたいのですが、SQL Server や SAS でも作業できます。
前もって感謝します。私の質問が明確でない場合はコメントしてください。
私が欲しいもの:
id a b
1 7028344 7181310
2 7030342 7030344
3 7030354 7030353
4 7030343 7030345
6 7030364 7008059
7 7030659 7066051
9 7031815 7045692
10 7032644 7102337