3

次のようなコードを実行したときに得られたさまざまな結果に困惑しています。

set.seed(100) 
test1<-randomForest(BinaryY~., data=Xvars, trees=51, mtry=5, seed=200) 
predict(test1, newdata=cbind(NewBinaryY, NewXs), type="response") 

そしてこのコード:

set.seed(100) 
test2<-randomForest(BinaryY~.,data=Xvars,trees=51, mtry=5,seed=200,xtest=NewXs, ytest=NewBinY)   

シード設定が同じであるため、2つのフォレストの混同行列は同じだと思いましたが、予測値や投票数と同様に異なります。最初はネクタイを壊しただけだと思ったので、木の数を奇数に変えて、もうネクタイがないようにしました。

誰かが私が望んでいることは単純な見落としであることに光を当てることができますか?NewBinaryYsデータセットとNewXデータセットに適用されたこれら2つのフォレストからの予測の結果が同じにならない理由がわかりません。

また、1本の木だけを使用しても結果が同じであることに気づきました。

ヒントと助けをありがとう。

4

1 に答える 1

1

xtest と ytest は、ランダム フォレストの実行自体のテスト セットを指定しているため、ランダムに選択された OOB サンプルの代わりにそれを使用していると思います。この場合、2 つの実行で異なるテスト データセットが使用され、異なる結果が作成されます。

于 2013-02-24T07:38:50.450 に答える