RWeka のDiscretize
フィルターを使用して一連のデータを離散化しようとしています。私のデータセットは 100 万件以上のレコードから始まりますが、返されるセットには 10 万件しかありません。この関数は、セット内のレコードごとにビンを返すことになっているように見えるので、データの 90% がどこに行ったのか知りたいです。
データには NA があるので、試してみると次のようになりました。
> disc_data = Discretize(class~.,data=num_data, na.action=na.pass)
Error in .jarray(x) : java.lang.OutOfMemoryError: Java heap space
私は他の誰かのコードに取り組んでいますが、以前は問題がなかったようです。これが離散化の理解の欠如なのか、それとも R の理解の欠如なのか、私にはわかりDiscretize
ません。