1

1つの独立変数は非常に重要で主要なものであるため、それだけを使用してモデルを構築し、残りの変数を使用して他のモデルを構築したいと思います。

kaggle.comでのタイタニックの競争のように、私sexは主要な変数として尊重し、それを使用してSVMモデルを構築しました。次に、、などの他の変数を使用してfare、cforestモデルを構築しました。aloneage

しかし、予測するsurvivalには、両方が必要です。では、どうすればそうできますか? lm()関数はに適用されないようS4 classです。

ここに私のコード:

## Modeling Begin

predictions <- NULL
NT <- 1000
## formula3 for 'gender' model using SVM
formula3 <- as.factor(survived) ~ pclass + sex
## formula1 and formula2 both for rest features without gender model
formula1.cf <- as.formula(as.factor(survived) ~ pclass  + alone + fare + age)
formula2.cf <- as.formula(          survived  ~ pclass  + alone + fare + age)

## Train SVM(only for gender model) and Predict
library(e1071)
formula3 <- as.factor(survived) ~ pclass + sex
tune <- tune.svm(formula3, data=clean.train, gamma=10^(-4:-1), cost=10^(1:4))
# summary(tune)
tune$best.parameters

model.svm <- svm(formula3, 
               data=clean.train, 
               type="C-classification", 
               kernel="radial", 
               probability=T, 
               gamma=tune$best.parameters$gamma, 
               cost=tune$best.parameters$cost)

## Train cForest
model.cforest <- cforest(formula2.cf, data=clean.train, 
                           control=cforest_unbiased(ntree=NT, trace=F))

ありがとう!

4

1 に答える 1