ランダム フォレスト モデル作成用のレンジャー パッケージの速度は気に入っていますが、mtry やツリーの数を調整する方法がわかりません。キャレットの train() 構文を使用してこれを実行できることはわかっていますが、純粋なレンジャーを使用することによる速度の向上を好みます。
ranger を使用した基本的なモデル作成の例を次に示します (これはうまく機能します)。
library(ranger)
data(iris)
fit.rf = ranger(
Species ~ .,
training_data = iris,
num.trees = 200
)
print(fit.rf)
調整オプションの公式ドキュメントを見ると、csrf() 関数がハイパーパラメーターを調整する機能を提供しているように見えますが、正しい構文を取得できません。
library(ranger)
data(iris)
fit.rf.tune = csrf(
Species ~ .,
training_data = iris,
params1 = list(num.trees = 25, mtry=4),
params2 = list(num.trees = 50, mtry=4)
)
print(fit.rf.tune)
結果:
Error in ranger(Species ~ ., training_data = iris, num.trees = 200) :
unused argument (training_data = iris)
そして、レンジャーが提供する通常の(読み取り:非csrf)rfアルゴリズムで調整したいと思います。レンジャーのいずれかのパスのハイパーパラメータ調整ソリューションに関するアイデアはありますか? ありがとうございました!