標準偏差を計算する簡単な例:
d <- c(2,4,4,4,5,5,7,9)
sd(d)
収量
[1] 2.13809
しかし、手作業で行う場合、答えは2です。ここで何が欠けていますか?
これを試して
R> sd(c(2,4,4,4,5,5,7,9)) * sqrt(7/8)
[1] 2
R>
標準偏差の推定に関する議論については、ウィキペディアの残りの記事を参照してください。「手作業で」使用された式を使用すると、推定値に偏りが生じ、sqrt((N-1)/ N)が修正されます。ここに重要な引用があります:
サンプルの標準偏差という用語は、未修正の推定量(Nを使用)に使用され、サンプルの標準偏差という用語は、修正された推定量(N − 1を使用)に使用されます。分母N− 1は、残差のベクトルの自由度の数です。
Rは、nではなく分母に(n-1)を想定しているように見えます。
母分散または標準偏差(分母としてn)が必要な場合は、これら2つのベクトル化された関数を定義します。
pop.var <- function(x) var(x) * (length(x)-1) / length(x)
pop.sd <- function(x) sqrt(pop.var(x))
ところで、カーンアカデミーはここで母集団とサンプルの標準偏差についてよく議論しています。
コマンドを実行することに注意してください
?sd
R Studioでは、関数のヘルプページが表示されます。詳細セクションには、
varと同様に、これは分母n-1を使用します。