このパッケージの作成者にメールを送信しようとしましたが、うまくいきませんでした。
rpart
13 の属性を持つ 4000 行のデータを使用しています。同じデータの 300 行に対して同じテストを問題なく実行できます。4000 行で実行すると、Rgui.exe は一貫して 50% の CPU で実行され、UI がハングします。実行すると、少なくとも4〜5時間はこのままになり、終了したり応答したりすることはありません。
これは、300 と 4000 のサイズのサブセットの両方で使用しているコードです。
train <- read.csv("input.csv", header=T)
y <- train[, 18]
x <- train[, 3:17]
library(rpart)
fit <- rpart(y ~ ., x)
これは の既知の制限rpart
ですか? 何か間違っていますか? 潜在的な回避策?