その意図は、洗濯機の故障 (0,1) の因果関係を見つけることです。ロジスティック分布のコマンドは、すべて 1 である従属変数を除いて、ランダム化された変数を作成しました。他のロジスティック分布からのシミュレーションは、ランダム化された 0 と 1 の値を作成しました。
変数、Hrs2、WashCap、および SpinSp は、n=3000 の正規分布として作成されました。ヒストグラムの x 軸に目的の間隔を合わせるために、平均値と SD を変更しました。
# Hours2
set.seed(600)
Hrs2 <- rnorm(3000, mean=300, sd=100)
#WashCap
set.seed(5)
WashCap <- rnorm(3000, mean=2.5, sd=1)
#SpinSp
set.seed(1100)
SpinSp <- rnorm(3000, mean=550, sd=250)
ロジスティック分布の差には、バイアスのある線形結合の追加変数が含まれます。
z=1 + 2*Hrs2 + 3*WashCap + 4*SpinSp
pr = 1/(1+exp(-z))
y <- rbinom(3000,1,pr)
WashMa = data.frame(y=y, Hrs2=Hrs2, WashCap=WashCap, SpinSp=SpinSp)
glm( y~Hrs2+WashCap+SpinSp,data=WashMa, family=binomial)
従属変数を修正してバリエーションを作成するための考えはありますか?