私は次のようにマトリックスを持ってsdist
いR
ます。
library("babynames")
library("stringdist")
d <- babynames
sdist <- stringdistmatrix(d$name[1:1000], d$name[1001:10000], method="lv", useBytes = T)
sdist[sdist > 3] <- Inf
数種類の要素しかない場合でも、この行列のサイズは大きくなります。
object.size(sdist)
72000112 bytes
dim(sdist)
[1] 1000 9000
length(sdist)
[1] 9000000
table(sdist)
sdist
0 1 2 3 Inf
4093 12125 72937 381084 8529761
これらの種類の行列のサイズを縮小する方法はありますか? 0の数が少ないため、スパース行列を使用できません。