2

125 個の変数を持つデータ フレームがあります。データは、以前の回答に基づいて意味がある場合にのみ質問を提示するロジックを含む調査からのものであるため、かなり多くの NA があります。

「ツリー」パッケージを使用して分類ツリーを構築しようとしています。木を作ろうとすると

t1 <- tree(outcome ~ ., data=surveyData)

エラーが発生します"no observations from which to fit a model"

このエラーの解釈方法がわかりませんし、フォーラムやドキュメントにも何も見つかりませんでした。

私はいくつかの小さなサブセットでツリーを構築しようとしてきましたが、うまくいくようです。

誰かが私を正しい方向に向けることができますか?

どうもありがとう!

4

1 に答える 1

3

問題が見つかりました。NAが多すぎるデータの列がいくつかあり、ツリー関数が不平を言いました。これらの変数を削除して、ツリーを作成できました。

問題のある列を削除し、この方法でツリーを構築しました。

naCols <- vector(length=125)
for (i in 1:125){ naCols[i]<- sum(is.na(data[,i]))}
subset <- data[,which(naCols < 10)]
myTree <- (outcome ~ ., data=subset)

すべての NA を処理する最善の方法を見つけるという大きな問題がありますが、それは別の話です。

于 2013-03-26T14:07:37.873 に答える