7

クラス変数がバイナリ (1 または 0) のデータでランダム フォレストを試行しています。ここに私が実行しているコードがあります:

forest.model <- randomForest(x = ticdata2000[,1:85], y = ticdata2000[,86], 
                       ntree=500,
                       mtry=9,
                       importance=TRUE,
                       norm.votes=TRUE,
                       na.action=na.roughfix,
                       replace=FALSE,
                             )

しかし、フォレストが最後に到達すると、次のエラーが発生します。

Warning message:
In randomForest.default(x = ticdata2000[, 1:85], y = ticdata2000[,  :
  The response has five or fewer unique values.  Are you sure you want to do regression?

もちろん、答えはノーです。私は回帰をしたくありません。2 つのクラスしか持たない単一の離散変数があります。もちろん、このモデルで予測を実行すると、0 と 1 のリストが必要なときに連続した数値が得られます。これを分類ではなく回帰を使用するために私が間違っていることを誰かに教えてもらえますか?

4

1 に答える 1

13

as.factor(または単に)を使用して、応答列を係数に変更しますfactorその変数を数値の 0 と 1として保存したので、R はそれを数値変数として正しく解釈します。R に別の方法で処理してもらいたい場合は、そのように指示する必要があります。

これは、y引数の下のドキュメントに記載されています。

応答ベクトル。因子の場合は分類が想定され、それ以外の場合は回帰が想定されます。省略した場合、randomForest は監視なしモードで実行されます。

于 2013-06-16T23:37:58.603 に答える