メモリを節約するために big.matrix として格納されている非常に大きなバイナリ マトリックスがあります (それ以外の場合は 2 GB を超えます - 500 万列と 100 行です)。
r <- 100
c <- 10000
m4 <- matrix(sample(0:1,r*c, replace=TRUE),r,c)
m4 <- cbind(m4, 1)
m4 <- as.big.matrix(m4)
一意の値が 1 つしかないすべての列を削除する必要があります (この場合は、0 のみまたは 1 のみ)。列の数が多いため、これを並行して実行できるようにしたいと考えています。
データをbig.matrixとして圧縮したまま、これを達成するにはどうすればよいですか? それを df に変換し、列をループして一意の値の数を探すことができますが、これには RAM が多すぎます。
ありがとう!