データセットから取得した 1000 を超えるサンプルに対してロジスティック回帰を複数回実行しています。私の質問は、私の結果を表示する最良の方法は何ですか? 適合曲線と予測曲線の両方の出力をプロットするにはどうすればよいですか?
これは、R の野球データセットを使用して、私が行っていることの例です。たとえば、モデルを 5 回当てはめて予測したいとします。(予測用に) 1 つのサンプルを取り出し、別のサンプルを当てはめに使用するたびに。
library(corrgram)
data(baseball)
#Exclude rows with NA values
dataset=baseball[complete.cases(baseball),]
#Create vector replacing the Leage (A our N) by 1 or 0.
PA=rep(0,dim(dataset)[1])
PA[which(dataset[,2]=="A")]=1
#Model the player be league A in function of the Hits,Runs,Errors and Salary
fit_glm_list=list()
prd_glm_list=list()
for (k in 1:5){
sp=sample(seq(1:length(PA)),30,replace=FALSE)
fit_glm<-glm(PA[sp[1:15]]~baseball$Hits[sp[1:15]]+baseball$Runs[sp[1:15]]+baseball$Errors[sp[1:15]]+baseball$Salary[sp[1:15]])
prd_glm<-predict(fit_glm,baseball[sp[16:30],c(6,8,20,21)])
fit_glm_list[[k]]=fit_glm;prd_glm_list[[k]]=fit_glm
}