0

47 個の観測値と 5 個の変数 (男性は 0、女性は 1 としてコード化) を含むデータ セットは、平均的な地位、収入、口頭で男性を予測しようとすると、95% CI で支出します。

私はlm<-spending ~ status + income + verbal + sex, teenspend平均を得るために私のものを使いました。私は自分の係数を次のように見つけました:

mdl$coefficient
 (Intercept)    sexfemale       status       income 
 22.55565063 -22.11833009   0.05223384   4.96197922 
      verbal 
 -2.95949350 

predict(mdl, sex=0, interval='confidence', level=0.90)

いくつかの質問: 上記の予測を使用しましたが、すべての観測値を取得しました。予測を見つけるにはどうすればよいですか?

        fit         lwr      upr
 1 -10.6507430 -21.4372267  0.1357407
 2  -9.3711318 -21.9428731  3.2006095
 3  -5.4630298 -15.0782882  4.1522286
 4  24.7957487  12.5630143 37.0284831

どうか明らかにしてください?

4

1 に答える 1

0

predict.lm のドキュメントを確認すると、sex=0ここでは引数を使用できないことがわかります。predict メソッドはその引数を無視するため、データ内のすべての観測値の適合値と信頼区間を取得します。次の方法で予測を指定できます
predict(mdl, newdata=teenspend[teenspend$sex==0,], interval="confidence")
。実際に予測間隔が必要な場合 (質問のタイトルで使用する場合) を選択する必要がありますinterval="prediction"

于 2013-02-27T14:19:36.337 に答える