1

RWeka のDiscretizeフィルターを使用して一連のデータを離散化しようとしています。私のデータセットは 100 万件以上のレコードから始まりますが、返されるセットには 10 万件しかありません。この関数は、セット内のレコードごとにビンを返すことになっているように見えるので、データの 90% がどこに行ったのか知りたいです。

データには NA があるので、試してみると次のようになりました。

> disc_data = Discretize(class~.,data=num_data, na.action=na.pass)
Error in .jarray(x) : java.lang.OutOfMemoryError: Java heap space

私は他の誰かのコードに取り組んでいますが、以前は問題がなかったようです。これが離散化の理解の欠如なのか、それとも R の理解の欠如なのか、私にはわかりDiscretizeません。

4

0 に答える 0