r - 値が 1 つしかない big.matrix からの列の削除

翻译自：https://stackoverflow.com/questions/49959260 2018-04-21T19:02:11.767

199 次

メモリを節約するために big.matrix として格納されている非常に大きなバイナリマトリックスがあります (それ以外の場合は 2 GB を超えます - 500 万列と 100 行です)。

r <- 100
c <- 10000
m4 <- matrix(sample(0:1,r*c, replace=TRUE),r,c)
m4 <- cbind(m4, 1)
m4 <- as.big.matrix(m4)

一意の値が 1 つしかないすべての列を削除する必要があります (この場合は、0 のみまたは 1 のみ)。列の数が多いため、これを並行して実行できるようにしたいと考えています。

データをbig.matrixとして圧縮したまま、これを達成するにはどうすればよいですか? それを df に変換し、列をループして一意の値の数を探すことができますが、これには RAM が多すぎます。

ありがとう！

1 に答える 1