1つの独立変数は非常に重要で主要なものであるため、それだけを使用してモデルを構築し、残りの変数を使用して他のモデルを構築したいと思います。
kaggle.comでのタイタニックの競争のように、私sex
は主要な変数として尊重し、それを使用してSVMモデルを構築しました。次に、、などの他の変数を使用してfare
、cforestモデルを構築しました。alone
age
しかし、予測するsurvival
には、両方が必要です。では、どうすればそうできますか?
lm()
関数はに適用されないようS4 class
です。
ここに私のコード:
## Modeling Begin
predictions <- NULL
NT <- 1000
## formula3 for 'gender' model using SVM
formula3 <- as.factor(survived) ~ pclass + sex
## formula1 and formula2 both for rest features without gender model
formula1.cf <- as.formula(as.factor(survived) ~ pclass + alone + fare + age)
formula2.cf <- as.formula( survived ~ pclass + alone + fare + age)
## Train SVM(only for gender model) and Predict
library(e1071)
formula3 <- as.factor(survived) ~ pclass + sex
tune <- tune.svm(formula3, data=clean.train, gamma=10^(-4:-1), cost=10^(1:4))
# summary(tune)
tune$best.parameters
model.svm <- svm(formula3,
data=clean.train,
type="C-classification",
kernel="radial",
probability=T,
gamma=tune$best.parameters$gamma,
cost=tune$best.parameters$cost)
## Train cForest
model.cforest <- cforest(formula2.cf, data=clean.train,
control=cforest_unbiased(ntree=NT, trace=F))
ありがとう!