2

このパッケージの作成者にメールを送信しようとしましたが、うまくいきませんでした。

rpart13 の属性を持つ 4000 行のデータを使用しています。同じデータの 300 行に対して同じテストを問題なく実行できます。4000 行で実行すると、Rgui.exe は一貫して 50% の CPU で実行され、UI がハングします。実行すると、少なくとも4〜5時間はこのままになり、終了したり応答したりすることはありません。

これは、300 と 4000 のサイズのサブセットの両方で使用しているコードです。

train <- read.csv("input.csv", header=T)
y <- train[, 18]
x <- train[, 3:17]
library(rpart)
fit <- rpart(y ~ ., x)

これは の既知の制限rpartですか? 何か間違っていますか? 潜在的な回避策?

4

2 に答える 2

2

実際のデータ (input.csv から) ではなく、同様の次元の rpart ランダム データをフィードすると、エラー メッセージを再現できますか? そうでない場合は、おそらくデータに問題があります (おそらくフォーマット?)。read.csv を使用してデータをインポートした後、str(train) からの出力を見て、データの形式の問題を確認します。

#How to do an equivalent rpart fit one some random data of equivalent dimension
dats<-data.frame(matrix(rnorm(4000*14), nrow=4000))

y<-dats[,1]
x<-dats[,-1]
library(rpart)
system.time(fit<-rpart(y~.,x))
于 2010-04-22T12:32:15.723 に答える
1

ここでの問題は、データ準備エラーでした。

ヘッダーは、データセットの途中で書き直されました。

于 2012-06-29T20:13:54.763 に答える