66

関数の使用で発生していたエラーについて、今日投稿しました。predict私はそれを修正することができ、正しい道を進んでいると思いました.

多数の観測 (実績) があり、外挿または予測したいデータ ポイントがいくつかあります。以前lmはモデルを作成していましpredictたが、予測子の入力となる実際の値で使用しようとしました。

このコードはすべて私の以前の投稿から繰り返されていますが、ここにあります:

df <- read.table(text = '
     Quarter Coupon      Total
1   "Dec 06"  25027.072  132450574
2   "Dec 07"  76386.820  194154767
3   "Dec 08"  79622.147  221571135
4   "Dec 09"  74114.416  205880072
5   "Dec 10"  70993.058  188666980
6   "Jun 06"  12048.162  139137919
7   "Jun 07"  46889.369  165276325
8   "Jun 08"  84732.537  207074374
9   "Jun 09"  83240.084  221945162
10  "Jun 10"  81970.143  236954249
11  "Mar 06"   3451.248  116811392
12  "Mar 07"  34201.197  155190418
13  "Mar 08"  73232.900  212492488
14  "Mar 09"  70644.948  203663201
15  "Mar 10"  72314.945  203427892
16  "Mar 11"  88708.663  214061240
17  "Sep 06"  15027.252  121285335
18  "Sep 07"  60228.793  195428991
19  "Sep 08"  85507.062  257651399
20  "Sep 09"  77763.365  215048147
21  "Sep 10"  62259.691  168862119', header=TRUE)

str(df)
'data.frame':   21 obs. of  3 variables:
 $ Quarter   : Factor w/ 24 levels "Dec 06","Dec 07",..: 1 2 3 4 5 7 8 9 10 11 ...
 $ Coupon: num  25027 76387 79622 74114 70993 ...
 $ Total: num  132450574 194154767 221571135 205880072 188666980 ...

コード:

model <- lm(df$Total ~ df$Coupon, data=df)

> model

Call:
lm(formula = df$Total ~ df$Coupon)

Coefficients:
(Intercept)    df$Coupon  
  107286259         1349 

コードの予測 (以前のヘルプに基づく):

(これらは、予測値を取得するために使用したい予測値です)

Quarter = c("Jun 11", "Sep 11", "Dec 11")
Total = c(79037022, 83100656, 104299800)
Coupon = data.frame(Quarter, Total)

Coupon$estimate <- predict(model, newdate = Coupon$Total)

これを実行すると、次のエラー メッセージが表示されます。

Error in `$<-.data.frame`(`*tmp*`, "estimate", value = c(60980.3823396919,  : 
  replacement has 21 rows, data has 3

モデルの構築に使用した元のデータ フレームには、21 個の観測値が含まれていました。現在、モデルに基づいて 3 つの値を予測しようとしています。

この関数をよく理解していないか、コードにエラーがあります。

助けていただければ幸いです。

ありがとう

4

4 に答える 4

103

まず、使用したい

model <- lm(Total ~ Coupon, data=df)

ありません model <-lm(df$Total ~ df$Coupon, data=df)

第二に、 と言うと、 を応答変数として、 を予測変数としてlm(Total ~ Coupon)使用するモデルを当てはめています。つまり、モデルの形式は で、係数は推定されます。応答は の左側に、予測変数は右側にあることに注意してください。TotalCouponTotal = a + b*Couponab~

このため、モデルの予測値を R に求める場合、一連の新しい予測子の値、つまり の新しい値Coupon、ないを提供する必要がありTotalます。

第三に、 の仕様から判断すると、 の関数としてnewdata適合するモデルを実際に求めているように見えますが、その逆ではありません。これをする:CouponTotal

model <- lm(Coupon ~ Total, data=df)
new.df <- data.frame(Total=c(79037022, 83100656, 104299800))
predict(model, new.df)
于 2012-01-27T04:06:13.010 に答える
9

ありがとうホン、それはまさに私が直面していた問題でした。表示されるエラーは、行数が間違っていることを示唆していますが、実際の問題は、モデルがコマンドを使用してトレーニングされ、最終的にパラメーターの名前が間違っていることです。

これは本当に重要な詳細であり、lm などではまったくわかりません。チュートリアルの一部では、次のような行を参照していますlm(olive$Area@olive$Palmitic)-最後に、オリーブ $ エリア NOT エリアの変数名になるため、を使用してエントリを作成するanewdata<-data.frame(Palmitic=2)ことはできません。使用するlm(Area@Palmitic,data=olive)と、変数名が正しく、予測が機能します。

本当の問題は、エラー メッセージが問題をまったく示していないことです。

警告メッセージ: 'anewdata' には 1 行ありましたが、変数に X 行があることがわかりました

于 2013-02-28T00:38:01.287 に答える
4

予測コードで newdate を使用している newdata の代わりに、一度確認してください。使用するだけCoupon$estimate <- predict(model, Coupon) で動作します。

于 2016-03-16T05:48:30.973 に答える