1

5 分割交差検証を使用して新しいデータを予測する際の GAM のパフォーマンスを評価したいと思います。モデルのトレーニングは、データの 80% のランダムなサブセットと残りの 20% のテスト セットに基づいています。トレーニング データとテスト データの間の平均二乗予測誤差を計算できますが、これを k 分割で実装する方法がわかりません。トレーニング データセットとテスト データセット、および MSPE を計算するための次のコードがあります。サンプル データは含めていませんが、含めることはできます。

indexes<-sample(1:nrow(data),size=0.2*nrow(data))
testP<-data[indexes,] #20%
trainP<-data[-indexes,]#80%
gam0<-gam(x~ NULL,family=quasibinomial(link='logit'),data=data,gamma=1.4)
pv<-predict(gam0,newdata=testP,type="response")
diff<-pv-testP$x #(predicted - observed)
diff2<-diff^2 #(predicted - observed)^2
mspegam0<-mean(diff2) 
4

0 に答える 0