-1

予測変数 (たとえばPrice ) を使用してdataset1と呼ぶデータセットがあります。データセットに存在するn 個の他の予測子に基づいて、価格の優れた単一の予測子を取得したいと考えています。しかし、nが大きい場合、これらすべてのモデルを手動で作成して調べることはできないため、次のようなものを使用したいと考えていました。

for (i in names(dataset1)) {
    model = lm(Price~i, dataset1)
    # Do stuff here with model, such as analyze R^2 values.
}

( for ループの内部を print(i) に置き換えると正しい名前が得られるため、これでうまくいくと思いました。) エラーは次のとおりです。

Error in model.frame.default(formula = Price ~ i, data = dataset1, drop.unused.levels =    TRUE) : 
variable lengths differ (found for 'i')

Rがi変数を読み取る方法に関する問題に対処するためのアドバイスはありますか? 他のソフトウェアを使用してこの問題にアプローチする方法は知っていますが、R がどのように機能するかを把握したいと思います。

4

2 に答える 2

2

*apply私は個人的にここにある種のことをします:

dat <- data.frame(price=1:10,y=10:1,z=1:10)
sapply(dat[2:3], function(q) coef(summary(lm(dat$price ~ q)))[2])

 y  z 
-1  1 

または、完全なモデル結果のリストを取得するには:

lapply(dat[2:3], function(q) coef(summary(lm(dat$price ~ q))))

$y
            Estimate   Std. Error       t value      Pr(>|t|)
(Intercept)       11 1.137008e-15  9.674515e+15 1.459433e-125
q                 -1 1.832454e-16 -5.457163e+15 1.423911e-123

$z
                Estimate   Std. Error      t value      Pr(>|t|)
(Intercept) 1.123467e-15 2.457583e-16 4.571429e+00  1.822371e-03
q           1.000000e+00 3.960754e-17 2.524772e+16 6.783304e-129

あなたが述べたように決定係数の値を取得するには:

sapply(dat[2:3], function(q) summary(lm(dat$price ~ q))$r.squared) 
于 2013-03-06T21:30:54.643 に答える
0

現時点では、名前を循環していません。試す

for(i in 2:ncol(dataset1)) #assuming Price is column 1

次に、を参照してください

Price ~ dataset1[, i]

あなたのループで。

しかし、統計の観点からのあなたのアプローチについてはよくわかりません。

于 2013-03-06T21:24:22.180 に答える