私は機械学習に非常に慣れておらず、 Kaggleで森林被覆予測コンテストを試みていますが、かなり早い段階でハングアップしています。以下のコードを実行すると、次のエラーが発生します。
train.default(x, y, weights = w, ...) のエラー: 最終調整パラメータを決定できませんでした さらに: 50 件以上の警告がありました (最初の 50 件を表示するには warnings() を使用します)。
# Load the libraries
library(ggplot2); library(caret); library(AppliedPredictiveModeling)
library(pROC)
library(Amelia)
set.seed(1234)
# Load the forest cover dataset from the csv file
rawdata <- read.csv("train.csv",stringsAsFactors = F)
#this data won't be used in model evaluation. It will only be used for the submission.
test <- read.csv("test.csv",stringsAsFactors = F)
########################
### DATA PREPARATION ###
########################
#create a training and test set for building and evaluating the model
samples <- createDataPartition(rawdata$Cover_Type, p = 0.5,list = FALSE)
data.train <- rawdata[samples, ]
data.test <- rawdata[-samples, ]
model1 <- train(as.factor(Cover_Type) ~ Elevation + Aspect + Slope + Horizontal_Distance_To_Hydrology,
data = data.train,
method = "rf", prox = "TRUE")