適切な場所でない場合は申し訳ありませんが、他の場所で答えが見つかりませんでした。chisq.test() の使い方にモンテカルロ シミュレーションを使用することについて、よく理解できたかどうかを知りたいです。
128 のレベル/クラスを持つ質的変数があります。私のサンプル サイズは 26 です (これ以上の「個人」をサンプリングすることはできませんでした)。したがって、明らかに、「個人」が0のレベルがいくつかあります。しかし実際には、可能な 127 のクラスのうち、非常に少数のクラスしか表現できません。カイ二乗検定を適用するには、各レベルに少なくとも 5 人の個体が必要であると言われているので (その理由は完全にはわかりません)、simulate.p.value オプションを (R で) 使用して、モンテカルロ シミュレーションを使用して分布を推定し、p 値を計算します。モンテカルロ シミュレーションを使用しない場合、R は p 値 < 1e-16 を返します。モンテカルロ シミュレーションでは、4e-5 の p 値が得られます。
26 個の 1 と 101 個のゼロのベクトルで p 値を計算しようとしましたが、モンテカルロ シミュレーションで p 値が 1 になりました。
私のサンプルサイズが可能なクラスの数と比較して小さい場合でも、観測された分布は、すべての可能なクラスが同じ確率 (1/127) で実際に存在する可能性が非常に低いと述べてもよろしいですか?人口 ?
ご協力いただきありがとうございます
ジュリアン