5

正規分布をさまざまな学生分布と比較するこのコードをインターネットで見つけました。

x <- seq(-4, 4, length=100)
hx <- dnorm(x)

degf <- c(1, 3, 8, 30)
colors <- c("red", "blue", "darkgreen", "gold", "black")
labels <- c("df=1", "df=3", "df=8", "df=30", "normal")

plot(x, hx, type="l", lty=2, xlab="x value",
  ylab="Density", main="Comparison of t Distributions")

for (i in 1:4){
  lines(x, dt(x,degf[i]), lwd=2, col=colors[i])
}

データを正規分布と比較したい状況にこれを適応させたいと思います。これは私のデータです:

library(quantmod)
getSymbols("^NDX",src="yahoo", from='1997-6-01', to='2012-6-01')
daily<- allReturns(NDX) [,c('daily')]
dailySerieTemporel<-ts(data=daily)
ss<-na.omit(dailySerieTemporel)

目的は、私のデータが正常かどうかを確認することです...誰かがこれで少し助けてくれますか? 本当にありがとうございました!

4

2 に答える 2

8

データが正規分布しているかどうかだけを知りたい場合は、Jarque-Bera 検定を適用できます。このテストは、null の下でデータが正規分布していることを示しています。詳細はこちらを参照してください。関数を使用してこのテストを実行できますjarque.bera.test

 library(tseries)
 jarque.bera.test(ss)

    Jarque Bera Test

data:  ss 
X-squared = 4100.781, df = 2, p-value < 2.2e-16

結果から明らかなように、null は 1% でも拒否されているため、データが正規分布していないことがわかります。

データが正規分布していない理由を確認するには、記述統計を見てください。

 library(fBasics)
 basicStats(ss)
                     ss
nobs        3776.000000
NAs            0.000000
Minimum       -0.105195
Maximum        0.187713
1. Quartile   -0.009417
3. Quartile    0.010220
Mean           0.000462
Median         0.001224
Sum            1.745798
SE Mean        0.000336
LCL Mean      -0.000197
UCL Mean       0.001122
Variance       0.000427
Stdev          0.020671
Skewness       0.322820
Kurtosis       5.060026

最後の 2 行から、ss過剰な尖度があり、歪度がゼロではないことがわかります。これは、Jarque-Bera テストの基礎です。

しかし、データの実際の分布を、データと同じ平均と分散を持つ正規分布確率変数と比較することに関心がある場合は、最初にカーネルを使用してデータから経験的密度関数を推定し、それをプロットすることができます。データと同じ平均と分散を持つ通常の確率変数を生成する必要がある場合は、次のようにします。

 plot(density(ss, kernel='epanechnikov'))
 set.seed(125)
 lines(density(rnorm(length(ss), mean(ss), sd(ss)), kernel='epanechnikov'), col=2)

ここに画像の説明を入力

このようにして、別の確率分布から別の曲線を生成できます。

@Alex Reynolds によって提案されたテストは、データがどのような分布から抽出された可能性があるかを知りたい場合に役立ちます。これがあなたの目標である場合は、任意の統計教科書で良さのテストを見ることができます。それでも、変数が正規分布しているかどうかだけを知りたい場合は、Jarque-Bera テストで十分です。

于 2012-08-05T23:38:19.977 に答える
4

QQShapiro-WilkまたはKS検定を見て、データが正規分布しているかどうかを確認してください。

于 2012-08-05T22:31:44.423 に答える