Rのソースコードは自由に入手できるため、R が一般化線形モデル(GLM)に適合させるために使用するコードを読んでいます。使用されるアルゴリズムは反復再重み付け最小二乗法(IRLS) と呼ばれ、かなり文書化されたアルゴリズムです。反復ごとに、重み付き最小二乗問題を解くために Fortran 関数が呼び出されます。
エンド ユーザーの観点からは、たとえばロジスティック回帰の場合、R での呼び出しは次のようになります。
y <- rbinom(100, 1, 0.5)
x <- rnorm(100)
glm(y~x, family=binomial)$coefficients
また、 interceptを使用したくない場合は、次の呼び出しのどちらでもかまいません。
glm(y~x-1, family=binomial)$coefficients
glm(y~x+0, family=binomial)$coefficients
ただし、式、つまりy~x
またはy~x-1
がコード内でどのように意味をなしており、切片を使用するかどうかについて理解されているかを理解することはできません。1 の列が にバインドされるコードの一部を探していましたが、x
何もないようです。
私が読んだ限りでは、呼び出された関数に現れるブール値の切片は、glm.fit
私が参照している切片と同じではありません。オフセットについても同様です。
glm
とに関するドキュメントglm.fit
はこちらにあります。