r - モデルに因子または多項式が含まれている場合、predict.lm を使用してモデル項の適合値を生成する

Question

predict.lmモデルの予測子の適合値を生成するために使用したいと思います。つまり、オブジェクトの係数推定値に、 n行lmの新しいデータフレームの値を乗算したいと考えています。結果は、各値に対応する係数が乗算された n行の行列になります。

これは、新しいデータフレームにオブジェクト内の各係数推定値の列がある場合に簡単に実行できlmます。例えば：

y       <- rnorm(6) 
x1      <- rnorm(6)
x2      <- rnorm(6) 
modEasy <- lm(y ~ x1 + x2)
dfEasy  <- data.frame(x1 = rnorm(6), x2 = rnorm(6))
predict(modEasy, newdata = dfEasy, type = "terms")

しかし、モデルに因子変数または多項式が含まれている場合、適合値を生成するのは困難です。このような場合、新しいデータフレームの列はk列より少なくなります。例えば：

y       <- rnorm(6) 
x1      <- rnorm(6)
x2      <- factor(rep(letters[1:3], 2))
modHard <- lm(y ~ x1 + x2)
dfHard  <- data.frame(x1 = rnorm(6), x2 = factor(rep(letters[1:3], each=2)))
predict(modHard, newdata = dfHard, type = "terms")

この場合、にはとの各因子水準のmodHard$coefficients推定値が含まれています。ただし、列は 2 つしかありません。1 つは用、もう 1 つは用です。その結果、は 2 つの列のみを持つ行列を返します。1 つは用、もう 1 つは用です。 x1x2dfHardx1x2predictx1x2

この状況では、predict でx1、の各レベルのおよびの列を含む行列を返すようにしますx2。このコードでそのマトリックスを作成できます。

mf <- model.frame(formula(modHard), dfHard)
mm <- model.matrix(formula(modHard), mf)
t(modHard$coefficients * t(mm))

しかし、もっと簡単な方法はありますか？

r - モデルに因子または多項式が含まれている場合、predict.lm を使用してモデル項の適合値を生成する

0 に答える 0

Related

Reference