Rでキャレットパッケージを使用してランダムフォレストを構築していmethod = "rf"
ます. ランダム フォレストのすべてのタイプは、各ツリーに対してランダムに選択された機能の数caret
だけ調整されているように見えます。各ツリーが (カートのように) 調整可能なパラメーターではないmtry
理由がわかりません。max_depth
私の考えでは、オーバーフィッティングを制限できるパラメーターです。たとえば、私の rf は、テスト データよりもトレーニング データの方が優れているようです。
model <- train(
group ~., data = train.data, method = "rf",
trControl = trainControl("repeatedcv", number = 5,repeats =10),
tuneLength=5
)
> postResample(fitted(model),train.data$group)
Accuracy Kappa
0.9574592 0.9745841
> postResample(predict(model,test.data),test.data$group)
Accuracy Kappa
0.7333333 0.5428571
ご覧のとおり、私のモデルは明らかに過適合です。ただし、これを処理するためにさまざまなことを試しましたが、何も機能しませんでした。私は常に、テスト データで 0.7 の精度、トレーニング データで 0.95 のような精度を持っています。これが、他のパラメーターを最適化したい理由です。
これを再現するためにデータを共有することはできません。