Naive Bayes モデルを実行していますが、klaR
パッケージを直接使用すると非常に高速で、標準のラップトップで計算するのに 1 秒もかかりません。
mod <- NaiveBayes(category ~ ., data=training, na.action = na.omit)
ただし、caret
パッケージのtrain()
インターフェイス (上記の関数の単なるラッパーだと思っていた) を使用すると、非常に長い時間がかかります。
mod <- train(category ~ ., data=training, na.action = na.omit, method="nb")
これは、train
デフォルトでリサンプリングが含まれているためだと思います。含めてみtrControl = trainControl(method = "none")
ましたが、次のエラーが表示されました。
Error in train.default(x, y, weights = w, ...) :
Only one model should be specified in tuneGrid with no resampling
これが発生する理由や、2 つの関数の速度の違いに関する一般的な考えはありますか?
また、速度の違いが数式インターフェイスに関連している可能性はありますか? 私の予測因子のいくつかは、100 レベルを超える因子です。