1

私は線形モデルを構築して、生息地の境界からの距離が昆虫の種類の豊富さに与える影響を評価しています。使用される機器にはいくつかの違いがあるため、豊かさに大きな影響を与えていないことを確認するために、カテゴリ変数として機器を含めています。

カテゴリ因子は 3 水準であるため、次のコードを使用して、r に lm でダミー変数を生成するように依頼しました。

lm(Richness ~ Distances + factor(Equipment), data = Data) 

モデルの概要を尋ねると、2 つのレベルとその係数が表示されます。これは、rがレベルの1つを「標準」として使用して、他のレベルの係数を比較していることを意味すると想定しています。

モデルに与える影響を確認するために、第 3 レベルの係数を見つけるにはどうすればよいですか?

ありがとうございました

4

2 に答える 2

2

lm(y~x-1)あなたの場合、要因の1つの参照レベルである切片を削除することができます。そうは言っても、レベルの 1 つを参照として使用する統計的な理由があります。

于 2015-08-01T02:34:14.573 に答える
1

係数を抽出する方法を決定するための簡単な例を次に示します。

# load data 
data(mtcars)
head(mtcars)

# what are the means of wt given the factor carb?
(means <- with(mtcars, tapply(wt, factor(carb), mean)))

# run the lm
mod <- with(mtcars, lm(wt~factor(carb)))

# extract the coefficients
coef(mod)

# the intercept is the reference level (i.e., carb 1)
coef(mod)[1]
coef(mod)[2:6]
coef(mod)[1] + coef(mod)[2:6]
means

したがって、この単純なケースでは、係数が参照レベル (つまり、切片) に単純に追加されていることがわかります。ただし、共変量がある場合はさらに複雑になります

mod2 <- lm(wt ~ factor(carb) + disp, data=mtcars)
summary(mod2)

disp = 0 の場合、切片は炭水化物 1 になります。

于 2015-08-01T04:18:48.770 に答える