1

RWekaパッケージを使用して、R (30 ~ 50 列、500k ~ 1M 行) のかなり大きな数値データのセットを離散化しようとしています。

私の元のコードは次のようになりました:

disc_data <- Discretize(class~., data=ndata, na.action=na.pass)

しかし、メモリエラーが発生しました。一度に 1 つの機能 (実際にはクラスを含めるために 2 列) でのみ関数を呼び出すと役立つと考えたので、次のように記述しました。

x <- cbind(ndata[1],ndata$class)
disc_data <- Discretize(class~., data=x, na.action=na.pass)

何らかのループで実行し、結果を組み合わせるつもりでした。ただし、これにより次のことがわかります。

Error in model.frame.default(formula = class ~ ., data = x, na.action = na.pass) : 
object is not a matrix

明確にするために、 Discretize は、行列ではなく、データの data.frame を取ります...

デバッグするか、メモリの問題に対処するためのより良い方法を使用して、これを修正するにはどうすればよいですか?

4

1 に答える 1