R に2 つのデータ列 (たとえばid
とmaster_id
) があります。 のすべての値id
が に存在する必要がありmaster_id
ます。しかし、そうではないと思われるので、どの値が間違っているかを特定したいと思います。10万単位のデータを扱っているため、ただデータを検査することはできません。
誤った値を見つけるにはどうすればよいですか?
R に2 つのデータ列 (たとえばid
とmaster_id
) があります。 のすべての値id
が に存在する必要がありmaster_id
ます。しかし、そうではないと思われるので、どの値が間違っているかを特定したいと思います。10万単位のデータを扱っているため、ただデータを検査することはできません。
誤った値を見つけるにはどうすればよいですか?
2日前 の回答です。
library(data.table)
DF1<-data.frame(x=1:3,y=4:6,t=10:12)
DF2<-data.frame(x=3:5,y=6:8,s=1:3)
library(data.table)
DF1 <- data.table(DF1, key = c("x", "y"))
DF2 <- data.table(DF2, key = c("x", "y"))
DF1[!DF2] # maybe you want this?
DF2[!DF1] # or maybe you want this?