r - R: 2 つの列の値に基づいて欠落しているレコードを取得する方法

Question

経度/緯度座標の 2 つの大きなデータフレームがCoastalStates_Taxあり、これらは数百万の座標があるCoastalStatesことを除いてほとんど同じです。のどの行がにないCoastalStates_Taxかを把握したいのですが、データセット内のどこにいても欠落している行のインデックスを追跡できる必要があります。CoastalStates_TaxCoastalStatesTax

これはCoastalStates_Tax次のようになります。

  RecordID_b PROPERTY LEVEL LONGITUDE PROPERTY LEVEL LATITUDE
1  132381977                -77.06421                39.16937
2  132381978                -77.18106                39.08811
3  132381979                -77.03353                39.02414
4  132381980                -77.09930                39.00716
5  132381981                -77.25450                39.10422
6  132381982                -77.02797                39.08087

そしてCoastalStates：

  RecordID PROPERTY LEVEL LONGITUDE PROPERTY LEVEL LATITUDE
1        1                -80.24787                25.85063
2        2                -80.14940                25.84582
3        3                -80.13115                25.85699
4        4                -80.37275                25.77741
5        5                -80.12095                25.82633
6        6                -80.39949                25.73273

で dplyranti_join関数を使用してみanti_join(CoastalStates_Tax,CoastalStates,by=c("PROPERTY LEVEL LONGITUDE","PROPERTY LEVEL LATITUDE"))ましたが、4,635,393 行しか表示されません。
2 つのデータセットの行数の差は 4,637,029 であるため、約 1600 行が不足していますが、その理由はわかりません。私はを誤用anti_joinしていますか?もしそうなら、これについて他の方法で何か提案はありますか?

r - R: 2 つの列の値に基づいて欠落しているレコードを取得する方法

1 に答える 1

Related

Reference