0

経度/緯度座標の 2 つの大きなデータフレームがCoastalStates_Taxあり、これらは数百万の座標があるCoastalStatesことを除いてほとんど同じです。のどの行が にないCoastalStates_Taxかを把握したいのですが、データセット内のどこにいても欠落している行のインデックスを追跡できる必要があります。CoastalStates_TaxCoastalStatesTax

これはCoastalStates_Tax次のようになります。

  RecordID_b PROPERTY LEVEL LONGITUDE PROPERTY LEVEL LATITUDE
1  132381977                -77.06421                39.16937
2  132381978                -77.18106                39.08811
3  132381979                -77.03353                39.02414
4  132381980                -77.09930                39.00716
5  132381981                -77.25450                39.10422
6  132381982                -77.02797                39.08087

そしてCoastalStates

  RecordID PROPERTY LEVEL LONGITUDE PROPERTY LEVEL LATITUDE
1        1                -80.24787                25.85063
2        2                -80.14940                25.84582
3        3                -80.13115                25.85699
4        4                -80.37275                25.77741
5        5                -80.12095                25.82633
6        6                -80.39949                25.73273

で dplyranti_join関数を使用してみanti_join(CoastalStates_Tax,CoastalStates,by=c("PROPERTY LEVEL LONGITUDE","PROPERTY LEVEL LATITUDE"))ましたが、4,635,393 行しか表示されません。
2 つのデータセットの行数の差は 4,637,029 であるため、約 1600 行が不足していますが、その理由はわかりません。私は を誤用anti_joinしていますか?もしそうなら、これについて他の方法で何か提案はありますか?

4

1 に答える 1