0

タブで区切られたCSV形式の2つのデータファイルがあります。ファイルは次の形式です。

EP Code    EP Name    Address    Region    ...
101654    Alpha     York Street    Northwest    ...
103628    Beta    5th Avenue    South    ...

EPコードは一意です。私がやりたいのは、EPコードに関して2つのファイルを比較し、異なる行を判別して、それらを新しいファイルに書き込むことです。

たとえば、file1.csvには800行、file2.csvには850行があります。file2は、file1と50行を完全に含むファイルである可能性があります。またはそれは可能性がありますfile1 - 10 rows + 60 rows。2つのデータセットの違いを確認したいと思います。相互の行には興味がありません。

どうすればRでそれを行うことができますか?

4

1 に答える 1

3

これを行うには、、、関数、setdiffを含む多くの方法があります。交差するセットを見つけて、次を使用して除外します。intersect%in%is.element!

diff1 <- file1[setdiff(file1$ep.code, file2$ep.code),]

また

diff2 <- file2[!(intersect(file2$ep.code, file1$ep.code)),]
于 2010-06-28T13:39:26.030 に答える