0

plyr チュートリアルを見ると、次の準備ができています。

b2 <- ddply(baseball, "id", transform, cyear = year - min(year) + 1)  
b2 <- ddply(b2, "id", transform, career = (cyear - 1) / max(cyear)) 
bruth <- subset(b2, id == "ruthba01")
# Could we model that as two straight lines?
bruth$p <- (bruth$career - 0.5) * 100

今いくつかのモデル

mod <- lm(g ~ p + p:I(p > 0), data = bruth)

との違いは何ですか?

mod <- lm(g ~ p + I(p > 0), data = bruth)

チェックすると

mod$model

どちらの場合も、同じ番号の同じ列が生成されます。
それでも回帰係数はまったく異なります...

この表記法が何を意味するか分かりますか?

4

1 に答える 1

1

次のコードを実行して、さまざまなモデルの影響を確認します。

 with(bruth, plot(p, predict(mod), type="l" )  )
 with(bruth, points(p, g,  col="red") )
 with(bruth, lines(p, predict(mod2), lty=3, lwd=2, col="red") )
 title(main="Different uses of I() and interaction")

セグメント化された回帰の出力に対する(任意の)結合点の選択の影響を強調しています。

ここに画像の説明を入力

于 2011-07-10T15:26:09.883 に答える