R でキャレット パッケージ経由で "gbm" を実行しようとしています。' method "gbm.fit" is not found ' エラーが発生しました。gbm パッケージがロードされ、R、RStudio、caret、および gbm が最新バージョンに更新されます (以下のバージョン情報を参照)。
これは[再現可能な]例です
必要なパッケージをロードする
library(caret)
library(gbm)
library(foreach)
library(doParallel)
library(magrittr)
library(plyr)
並行して開始する (または開始しない場合、結果は同じです)
cl=makeCluster(5)
registerDoParallel(cl)
キャレットの制御パラメータの設定 - ほとんどすべてデフォルト
gbm.fit.control = trainControl(method = "cv",
number = 5,
repeats = 1,
p = 0.75,
verboseIter = T,
returnData = TRUE,
summaryFunction = defaultSummary
selectionFunction = "best",
allowParallel = FALSE)
パラメータ検索用のグリッドの設定 - 特別なことは何もありません
gbmGrid <- expand.grid(interaction.depth = c(2,5,8),
n.trees = c(500,2000,5000),
shrinkage = c(0.1,0.01),
n.minobsinnode = c(10))
例のダミー データを生成します。実際のデータはもっと複雑ですが、このおもちゃの例でも結果は同じです
tn.XY=data.frame(y=runif(100), x1=runif(100), x2=runif(100), x3=runif(100))
train 関数を実行しようとしています
gbmFit3 <- train(y~x1+x2+x3, data = tn.XY,
method = "gbm",
trControl = gbm.fit.control,
verbose = FALSE,
tuneGrid = gbmGrid,
## Specify which metric to optimize
metric = "RMSE")
エラーの取得 = gbm.fit が見つかりません
+ Fold1: shrinkage=0.01, interaction.depth=2, n.minobsinnode=10, n.trees=5000
model fit failed for Fold1: shrinkage=0.01, interaction.depth=2, n.minobsinnode=10, n.trees=5000
Error in do.call("gbm.fit", modArgs) : could not find function "gbm.fit"
- Fold1: shrinkage=0.01, interaction.depth=2, n.minobsinnode=10, n.trees=5000
+ Fold1: shrinkage=0.01, interaction.depth=5, n.minobsinnode=10, n.trees=5000
model fit failed for Fold1: shrinkage=0.01, interaction.depth=5, n.minobsinnode=10, n.trees=5000
Error in do.call("gbm.fit", modArgs) : could not find function "gbm.fit"
...
And it continues for every fold
たとえば、(ここのように)並列の問題である可能性があると思いました。ただし、並列実行を無効にしても効果はありませんでした。私はちょっと迷っています。一部の人々がキャレットを使用して大成功を収めたことを知っています。おそらく何か基本的なもの、私が欠けているものが必要です。
R バージョン情報
R version 3.2.1 (2015-06-18)
Platform: x86_64-w64-mingw32/x64 (64-bit)
Running under: Windows 7 x64 (build 7601) Service Pack 1
locale:
[1] LC_COLLATE=English_United States.1252 LC_CTYPE=English_United States.1252 LC_MONETARY=English_United States.1252
[4] LC_NUMERIC=C LC_TIME=English_United States.1252
attached base packages:
[1] parallel splines stats graphics grDevices utils datasets methods base
other attached packages:
[1] plyr_1.8.3 magrittr_1.5 doParallel_1.0.8 iterators_1.0.7 foreach_1.4.2 gbm_2.1-06 survival_2.38-3
[8] caret_6.0-52 ggplot2_1.0.1 lattice_0.20-33 readr_0.1.1 installr_0.16.0