3

私は次のようにマトリックスを持ってsdistRます。

library("babynames")
library("stringdist")
d <- babynames
sdist <- stringdistmatrix(d$name[1:1000], d$name[1001:10000], method="lv", useBytes = T)
sdist[sdist > 3] <- Inf

数種類の要素しかない場合でも、この行列のサイズは大きくなります。

object.size(sdist)
72000112 bytes

dim(sdist)
[1] 1000 9000
length(sdist)
[1] 9000000

table(sdist)
sdist
      0       1       2       3     Inf 
   4093   12125   72937  381084 8529761 

これらの種類の行列のサイズを縮小する方法はありますか? 0の数が少ないため、スパース行列を使用できません。

4

0 に答える 0