RWeka
パッケージを使用して、R (30 ~ 50 列、500k ~ 1M 行) のかなり大きな数値データのセットを離散化しようとしています。
私の元のコードは次のようになりました:
disc_data <- Discretize(class~., data=ndata, na.action=na.pass)
しかし、メモリエラーが発生しました。一度に 1 つの機能 (実際にはクラスを含めるために 2 列) でのみ関数を呼び出すと役立つと考えたので、次のように記述しました。
x <- cbind(ndata[1],ndata$class)
disc_data <- Discretize(class~., data=x, na.action=na.pass)
何らかのループで実行し、結果を組み合わせるつもりでした。ただし、これにより次のことがわかります。
Error in model.frame.default(formula = class ~ ., data = x, na.action = na.pass) :
object is not a matrix
明確にするために、 Discretize は、行列ではなく、データの data.frame を取ります...
デバッグするか、メモリの問題に対処するためのより良い方法を使用して、これを修正するにはどうすればよいですか?