4

ここで私が間違っていることを誰かに教えてもらえますか?おもちゃのデータセットでRパッケージのRecordLinkageの比較機能をテストしようとしています

> test<-cbind(
+ a = c(1, 1, 1), 
+ b = c(2, 0, 2), 
+ c = c(1, 2, 1))
> 
> test
     a b c
[1,] 1 2 1
[2,] 1 0 2
[3,] 1 2 1
> 
> results <- compare.dedup(test)
> 
> results$pairs
  id1 id2 a b c is_match
1   1   2 1 0 0       NA
2   1   3 1 1 1       NA
3   2   3 1 0 0       NA
> 

レコード1と3は明らかに一致していますが、is_matchは3つのペアすべてでNAです。

4

3 に答える 3

2

ID インデックスを使用するのを忘れたため:

> compare.dedup(cbind(a=c(1,1,1), b=c(2,0,2), c=c(1,2,1)), identity=c(1,2,3))$pair
id1 id2 a b c is_match
1   1   2 1 0 0        0
2   1   3 1 1 1        0
3   2   3 1 0 0        0
于 2011-09-03T18:07:33.397 に答える