r - mgcv を使用した予測誤差の k 分割交差検証

翻译自：https://stackoverflow.com/questions/25557109 2014-08-28T20:05:06.490

858 次

5 分割交差検証を使用して新しいデータを予測する際の GAM のパフォーマンスを評価したいと思います。モデルのトレーニングは、データの 80% のランダムなサブセットと残りの 20% のテストセットに基づいています。トレーニングデータとテストデータの間の平均二乗予測誤差を計算できますが、これを k 分割で実装する方法がわかりません。トレーニングデータセットとテストデータセット、および MSPE を計算するための次のコードがあります。サンプルデータは含めていませんが、含めることはできます。

indexes<-sample(1:nrow(data),size=0.2*nrow(data))
testP<-data[indexes,] #20%
trainP<-data[-indexes,]#80%
gam0<-gam(x~ NULL,family=quasibinomial(link='logit'),data=data,gamma=1.4)
pv<-predict(gam0,newdata=testP,type="response")
diff<-pv-testP$x #(predicted - observed)
diff2<-diff^2 #(predicted - observed)^2
mspegam0<-mean(diff2)

r - mgcv を使用した予測誤差の k 分割交差検証

0 に答える 0

Related

Reference