キーワード間の類似性に関する大きなデータ フレームがあり、すべてのペアごとの類似性を含む形式に変更したいと考えています。現在のデータ フレームは次のようになります。
> df
kwd1 kwd2 sim
1 a b 1
2 b a 1
3 c a 2
4 a c 2
そして、それを次の形式の data.frame に変換したいと思います。
> df
kwd1 kwd2 sim
a b 1
a c 2
b c 0
助けてくれてありがとう!
これまでの私のコードは次のとおりです。
df <- data.frame(c('a', 'b', 'c', 'a'), c('b', 'a', 'a', 'c'), c(.1,.1,.2,.2))
colnames(df) = c('kwd1', 'kwd2', 'sim')
> dput(df)
structure(list(kwd1 = structure(c(1L, 2L, 3L, 1L), .Label = c("a",
"b", "c"), class = "factor"), kwd2 = structure(c(2L, 1L, 1L,
3L), .Label = c("a", "b", "c"), class = "factor"), sim = c(1,
1, 2, 2)), .Names = c("kwd1", "kwd2", "sim"), row.names = c(NA,
-4L), class = "data.frame")