1

重複の可能性:
データがRで正規分布しているかどうかを確認する

正規性をテストしている6セットの残差(適合モデル)があります(モデルからの偏差が機器のノイズの範囲内にあることを実証しようとしています)。

それらすべてのカーネル密度プロットはほぼガウス分布に見え、qqnormプロットはよく見えます。これらすべてを、shapiro.test{base}とad.test{nortest}の2つの正規性検定で実行しました。これらのテストは、1つを除いてすべてのデータセットが正常であることを示しています(p >> 0.05、正常性の帰無仮説を受け入れます)。通常、これらの結果に疑問を呈することはありませんが、「正常ではない」(p <0.05、正常性の帰無仮説を棄却する)として返されるテストは、最もガウスに見えるデータセットからのものです...私は混乱しており、助けてくれてありがとう!

これが私の残差カーネル密度プロットの行列であり、アンダーソン-ダーリング正規性検定(ad.test)のp値が示されています。すべてのグラフは同じスケール(x&y)です。非正常な特性は、赤でマークされたCvsDグラフです。

これは、CvsD比較のデータへのリンクです。

なぜこれらの残差は正常ではないのですか!?

4

1 に答える 1

1

実際、これは私にはあまりガウス的ではありません。nが大きいt分布に似ています。これは、正規曲線よりもはるかに「スパイク状」です。ad.testshapiroテストの両方がp<0.05shapiro.testを返します(データではp = 0.002655を返します)。

ただし、正規性検定の有用性には異議が唱えられていることに注意してください。たとえば、この質問を参照してください。基本的に、サンプルサイズが大きい場合、正規分布からのわずかな偏差でもペナルティが課せられ、H0は拒否されます。

とはいえ、サンプルサイズが328しかないことを考えると、あなたの場合、分布は実際には正常ではないと私は信じています。

于 2012-11-09T13:59:31.757 に答える