5

私はRが初めてで、apply関数とその仕組みについて学んでいます。lm変数 x の適合から、製品の色とブランドごとに数年間にわたって係数を抽出したいだけです。

for ループを作成し、モデル年ごとにデータをサブセット化して適合させることができることはわかっていますが、組み込み関数をもっと使い始める時が来たと思うので、by 関数または適用の 1 つを使用してそれを実行できるようにしたいと考えています。機能。これが私が考えていたことです。

#some made up data

x<-rnorm(50,13400,1200)
color<-sample(factor(c("Red","Black","Blue","Green","White")),50,replace=T)
year<-sample(factor(2006:2012),50,replace=T)
brand<-sample(factor(c("A","B","C","D")),50,replace=T)

d<-data.frame(x,color,year,brand)

#now I want to fit the model lm(x~color+brand) for each year level
#this is what I was thinking...

tmp<-with(d,by(x,year,function(y) lm(x~color,data=y)))
sapply(tmp,coef)

eval(predvars, data, env) のエラー: 数値 'envir' arg の長さが 1 ではありません

これは、入力したときに R が与えた例に基づいています。help(by)

4

3 に答える 3

6

代わりにこれを試してください:

tmp <- by(d, year, function(d.subset) lm(x~color, data=d.subset))
于 2012-07-01T18:30:57.867 に答える
5

R の基本関数を使ってこれを行うことに加えて (関数がどのように機能するかを学ぶには良い考えです)、以前に誰がこれに取り組んだかを調べることも価値があります。線形モデルをデータ セットの各サブセットに当てはめることはよくあることですが、このために便利なツールがいくつか作成されていることがわかりました。

パッケージlme4と functionを見てみてくださいlmList。の例から?lmList

(fm1 <- lmList(Reaction ~ Days | Subject, sleepstudy))

これは、線形モデルReaction ~ Daysを ごとに個別に当てはめSubjectます。エクストラクタ メソッドは次のものに直接作用するため、これは便利ですfm1

> coef(fm1)
    (Intercept)      Days
308    244.1927 21.764702
309    205.0549  2.261785
310    203.4842  6.114899
330    289.6851  3.008073
331    285.7390  5.266019
332    264.2516  9.566768
333    275.0191  9.142045
334    240.1629 12.253141
335    263.0347 -2.881034
337    290.1041 19.025974
349    215.1118 13.493933
350    225.8346 19.504017
351    261.1470  6.433498
352    276.3721 13.566549
369    254.9681 11.348109
370    210.4491 18.056151
371    253.6360  9.188445
372    267.0448 11.298073

(行番号は の id 値ですSubjects) のヘルプ ファイルを?lmList参照して、信頼区間やプロットなどに使用できる他の方法を確認してください。

于 2012-07-01T18:37:08.317 に答える
2

これは、より現代的なパッケージでははるかに簡単ですdata.table

library(data.table)
setDT(d)
d[ , .(reg = list(lm(x ~ color))), by = year]
#    year  reg
# 1: 2012 <lm>
# 2: 2006 <lm>
# 3: 2011 <lm>
# 4: 2008 <lm>
# 5: 2007 <lm>
# 6: 2010 <lm>
# 7: 2009 <lm>

reg列にはオブジェクトlmがあります。単純なリストを混乱させないように、ラップする必要があることに注意してlmください(.list(.)data.tableis.list(lm(x ~ color, data = d))TRUE

于 2017-12-13T08:50:19.900 に答える