経度/緯度座標の 2 つの大きなデータフレームがCoastalStates_Tax
あり、これらは数百万の座標があるCoastalStates
ことを除いてほとんど同じです。のどの行が にないCoastalStates_Tax
かを把握したいのですが、データセット内のどこにいても欠落している行のインデックスを追跡できる必要があります。CoastalStates_Tax
CoastalStates
Tax
これはCoastalStates_Tax
次のようになります。
RecordID_b PROPERTY LEVEL LONGITUDE PROPERTY LEVEL LATITUDE
1 132381977 -77.06421 39.16937
2 132381978 -77.18106 39.08811
3 132381979 -77.03353 39.02414
4 132381980 -77.09930 39.00716
5 132381981 -77.25450 39.10422
6 132381982 -77.02797 39.08087
そしてCoastalStates
:
RecordID PROPERTY LEVEL LONGITUDE PROPERTY LEVEL LATITUDE
1 1 -80.24787 25.85063
2 2 -80.14940 25.84582
3 3 -80.13115 25.85699
4 4 -80.37275 25.77741
5 5 -80.12095 25.82633
6 6 -80.39949 25.73273
で dplyranti_join
関数を使用してみanti_join(CoastalStates_Tax,CoastalStates,by=c("PROPERTY LEVEL LONGITUDE","PROPERTY LEVEL LATITUDE"))
ましたが、4,635,393 行しか表示されません。
2 つのデータセットの行数の差は 4,637,029 であるため、約 1600 行が不足していますが、その理由はわかりません。私は を誤用anti_join
していますか?もしそうなら、これについて他の方法で何か提案はありますか?