0

Rでキャレットパッケージを使用してランダムフォレストを構築していmethod = "rf"ます. ランダム フォレストのすべてのタイプは、各ツリーに対してランダムに選択された機能の数caretだけ調整されているように見えます。各ツリーが (カートのように) 調整可能なパラメーターではないmtry理由がわかりません。max_depth私の考えでは、オーバーフィッティングを制限できるパラメーターです。たとえば、私の rf は、テスト データよりもトレーニング データの方が優れているようです。

model <- train(
          group ~., data = train.data, method = "rf",
          trControl = trainControl("repeatedcv", number = 5,repeats =10),
          tuneLength=5
        )


>         postResample(fitted(model),train.data$group)
Accuracy    Kappa 
0.9574592 0.9745841 

>         postResample(predict(model,test.data),test.data$group)
 Accuracy     Kappa 
0.7333333 0.5428571 

ご覧のとおり、私のモデルは明らかに過適合です。ただし、これを処理するためにさまざまなことを試しましたが、何も機能しませんでした。私は常に、テスト データで 0.7 の精度、トレーニング データで 0.95 のような精度を持っています。これが、他のパラメーターを最適化したい理由です。

これを再現するためにデータを共有することはできません。

4

0 に答える 0