0

私のアプローチが正しいかどうかを誰かが確認できれば幸いです。要するに、エラー計算が正しい方法であるかどうかという質問になります。次のデータがあると仮定します。

data = c(23.7,25.47,25.16,23.08,24.86,27.89,25.9,25.08,25.08,24.16,20.89)

さらに、データが正規分布に従っているかどうかを確認したいと思います。

編集:テストなどがあることは知っていますが、信頼できる線でqqplotを構築することに集中します。カーパッケージにメソッドがあることは知っていますが、これらのラインの構築を理解したいです。

したがって、サンプル データと理論上の分布のパーセンタイルを計算します (推定mu = 24.6609と を使用しsigma = 1.6828ます。したがって、パーセンタイルを含むこれら 2 つのベクトルになります。

percentileReal =  c(23.08,23.7,24.16,24.86,25.08,25.08,25.16,25.47,25.90)
percentileTheo =  c(22.50,23.24,23.78,24.23,24.66,25.09,25.54,26.08,26.82)

alpha=0.05ここで、理論上のパーセンタイルの信頼区間を計算したいと思います。私が自分自身が正しいことを思い出すと、式は次のように与えられます

error = z*sigma/sqrt(n),
value = +- error

と。n=length(data)_z=quantil of the normal distribution for the given p

したがって、2 番目のパーセンタイルの信頼区間を取得するには、次のようにします。

error = (qnorm(20+alpha/2,mu,sigma)-qnorm(20-alpha/2,mu,sigma))*sigma/sqrt(n) 

値を挿入します。

error = (qnorm(0.225,24.6609,1.6828)-qnorm(0.175,24.6609,1.6828)) * 1.6828/sqrt(11)
error = 0.152985
confidenceInterval(for 2nd percentil) = [23.24+0.152985,23.24-0.152985]
confidenceInterval(for 2nd percentil) = [23.0870,23.3929]

最後に私は持っています

percentileTheoLower = c(...,23.0870,.....)
percentileTheoUpper = c(...,23.3929,.....)

残りも同じ……。

それで、あなたはどう思いますか、私はそれで行くことができますか?

4

1 に答える 1

0

データが正規分布に従うかどうかをテストすることが目的の場合は、shapiro.wilk テストを使用します。

shapiro.test(data)
# Shapiro-Wilk normality test
# data:  data
# W = 0.9409, p-value = 0.5306

1-p分布が非正規である確率です。したがって、p>0.05分布が非正規であると断言することはできません。大まかな解釈は、「分布が正規分布である確率は 53% である」というものです。

も使用できますqqplot(...)。このプロットが線形に近いほど、データが正規分布している可能性が高くなります。

 qqnorm(data)

最後に、R にはNortestパッケージがあります。これには、とりわけ、正規性の Pearson Chi-Sq 検定があります。

 library(nortest)
 pearson.test(data)
 #  Pearson chi-square normality test
 #  data:  data
 #  P = 3.7273, p-value = 0.2925

この (より保守的な) テストは、分布が正規分布である可能性が 29% しかないことを示唆しています。これらすべてのテストは、ドキュメントで完全に説明されています。

于 2013-12-09T21:59:46.607 に答える