1

データセットがあり、このデータセットにロジスティック分布があるかどうかを知りたいのですが。データセットのヒストグラムを作成したとき( http://imageshack.us/photo/my-images/593/histogram.png/のヒストグラムを参照)、ロジスティック分布になっているようですが、確かにRでロジスティック分布をテストするのが好きです。私の質問は次のとおりです。ロジスティック分布のデータをテストする方法はありますか。これをどのように行いますか。

追加情報:データセットは8544項目で構成されています。データは、2つの地理的ポイント間の水平距離(km)です。

ご清聴ありがとうございました

サンダー

4

1 に答える 1

7

Rでは、ks.testorchisq.test関数(およびおそらく他の関数)を使用して、仮説の分布に対してテストできます。これらのテスト(およびその他のテスト)はすべて除外テストであることに注意してください。重要でない結果は、データが特定の分布からのものであることを保証するものではなく、除外できないことだけを保証します。また、サンプルサイズが8544の場合、これらのテストは非常に強力である可能性があります。つまり、わずかな無意味な違いを見つける力があり、「十分に近い」場合でも帰無仮説を棄却する可能性があります。また、最初にデータを見て分布を決定したという事実は、結果にバイアスをかける可能性があります。

ロジスティック分布が正確ではなく「十分に近い」かどうかをよりよく感じることができる別のアプローチはvis.test、TeachingDemosパッケージの関数を使用することです(テストとどのような仮定を理解するために、ヘルプページで参照されているペーパーを必ず読んでください)あなたが作っている)。

最も重要なのは、データにつながる科学を理解することです。ロジスティック分布は科学的に意味がありますか?他にどのようなディストリビューションが合理的である可能性がありますか?また、データを使用して回答しようとしている質問と、それらの分布の回答にどのような影響があるかを理解します(たとえば、CLTでは、正規分布を使用して一部の質問に回答できますが、他の質問には回答できません。データはロジスティックまたは類似のものからのものですが)。

于 2012-08-02T16:34:58.457 に答える