-1

R に2 つのデータ列 (たとえばidmaster_id) があります。 のすべての値idが に存在する必要がありmaster_idます。しかし、そうではないと思われるので、どの値が間違っているかを特定したいと思います。10万単位のデータを扱っているため、ただデータを検査することはできません。

誤った値を見つけるにはどうすればよいですか?

4

2 に答える 2

0

2日前 の回答です。

library(data.table)
DF1<-data.frame(x=1:3,y=4:6,t=10:12)
DF2<-data.frame(x=3:5,y=6:8,s=1:3)
library(data.table)
DF1 <- data.table(DF1, key = c("x", "y"))
DF2 <- data.table(DF2, key = c("x", "y"))
DF1[!DF2] # maybe you want this?
DF2[!DF1] # or maybe you want this?
于 2013-06-11T21:22:34.230 に答える