43

R Formulaのドキュメントを読んでいて、 depmix (depmixS4 パッケージから) の操作方法を理解しようとしていました。

さて、depmixS4 のドキュメントでは、サンプル式は のようなものになりがちy ~ 1です。のような単純なケースy ~ xでは、入力 x と出力 y の関係を定義しているためy = a * x + baは勾配、bは切片である に似ていることがわかります。

に戻るとy ~ 1、数式にうんざりしています。y = 1(y = 1の水平線)と同等ですか?

少しコンテキストを追加するために、depmixs4 のドキュメントを見ると、以下に 1 つの例があります。

depmix(list(rt~1,corr~1),data=speed,nstates=2,family=list(gaussian(),multinomial()))

~ 1一般的に、 で終わる式は混乱を招くと思います。~ 1何を意味するのか説明できますy ~ 1か?

4

3 に答える 3

47

R のモデル式 (アスタリスク、プラス、キャレット) で使用される演算子の多くには、モデル固有の意味があり、これはその 1 つです。「1」記号は切片を示します。

つまり、独立変数がゼロであるか影響がない場合に、従属変数が持つと予想される値です。(モデル用語のより一般的な数学的意味を使用するには、それらを で囲みますI())。切片は通常想定されるため、切片なしでモデルを明示的に述べるコンテキストでそれを見るのが最も一般的です。

x 上の y の線形回帰モデルに同じモデルを指定する 2 つの方法を次に示します。1 つ目は暗黙の切片項を持ち、2 つ目は明示的な切片を持ちます。

y ~ x
y ~ 1 + x

原点を通る x 上の y の線形回帰 (つまり、切片項なし) を与える方法を次に示します。

y ~ 0 + x
y ~ -1 + x
y ~ x - 1

あなたが言及した特定のケースでは ( y ~ 1 )、y は他の変数によって予測されていないため、Paul Hiemstra が述べたように、自然な予測は y の平均です。

> data(city)
> r <- lm(x~1, data=city)
> r

Call:
lm(formula = x ~ 1, data = city)

Coefficients:
(Intercept)  
       97.3  

> mean(city$x)
[1] 97.3

そして、 a でインターセプトを削除すると、-1何も残りません。

> r <- lm(x ~ -1, data=city)
> r

Call:
lm(formula = x ~ -1, data = city)

No coefficients

formula()はオブジェクトから式を抽出する関数であり、そのヘルプ ファイルは R でのモデル式の指定について読むのに最適な場所ではありません。この説明またはAn Introduction to R の第 11 章を参照することをお勧めします。

于 2012-11-13T19:20:12.237 に答える
20

モデルが次の形式である場合、 y ~ x1 + x2これは(大まかに言えば)次を表します。

 y = β0 + β1(x1) + β2(x2)

 Which is of course the same as 
 y = β0(1) + β1(x1) + β2(x2)

+1上記の式には暗黙の式があります。実は上の式はy ~ 1 + x1 + x2

y が他の変数に依存しない、非常に単純な式を作成できます。これはあなたが参照している式で y ~ 1 あり、おおよそ次のようになります

 y = β0(1) = β0

@Paulが指摘しているように、単純なモデルを解くと、β0 = mean (y)




ここに例があります

  # Let's make a small sample data frame
  dat <- data.frame(y= (-2):3, x=3:8)

  # Create the linear model as above
  simpleModel <- lm(y ~ 1, data=dat)

  ## COMPARE THE COEFFICIENTS OF THE MODEL TO THE MEAN(y)
  simpleModel$coef
    # (Intercept) 
    #         0.5 

  mean(dat$y)
    # [1] 0.5
于 2012-11-13T19:33:39.810 に答える
5

一般に、このような式は、従属変数と独立変数の間の関係を線形モデルの形式で表します。左辺は従属変数、右辺は独立変数です。独立変数は、線形モデルの傾向成分を計算するために使用され、残差はある種の分布を持つと想定されます。独立変数が 1 に等しい場合~ 1、トレンド コンポーネントは単一の値 (データの平均値など) です。つまり、線形モデルには切片しかありません。

于 2012-11-13T19:00:24.907 に答える