0

1 つのコピー領域に 4 つの遺伝子型の観測カウントのサンプルがあります。私がやりたいことは、これらの遺伝子型の対立遺伝子頻度を計算し、これらの頻度のテストが、R のカイ 2 乗を使用して 25%:25%:25%:25% の期待値から大きく外れることです。

これまでのところ、私は得ました:

> a <- c(do.call(rbind, strsplit(as.character(gdr18[1,9]), ",")), as.character(gdr18[1,8]))
> a
[1] "27" "30" "19" "52"

次に、合計数を取得します。

> sum <- as.numeric(a[1]) + as.numeric(a[2]) + as.numeric(a[3]) + as.numeric(a[4])
> sum
[1] 128

現在の周波数:

> af1 <- as.numeric(a[1])/sum
> af2 <- as.numeric(a[2])/sum
> af3 <- as.numeric(a[3])/sum
> af4 <- as.numeric(a[4])/sum
> af1
[1] 0.2109375
> af2
[1] 0.234375
> af3
[1] 0.1484375
> af4
[1] 0.40625

ここで私は今迷っています。af1、af2、af3、af4 が 0.25、0.25、0.25、0.25 から大きく外れているかどうかを知りたい

Rでこれを行うにはどうすればよいですか?

ありがとう、エイドリアン

編集:

申し分なく、私は示唆されているように chisq.test() を試しています:

> p <- c(0.25,0.25,0.25,0.25)
> chisq.test(af, p=p)

        Chi-squared test for given probabilities

data:  af
X-squared = 0.146, df = 3, p-value = 0.9858

Warning message:
In chisq.test(af, p = p) : Chi-squared approximation may be incorrect

警告メッセージは何を伝えようとしていますか? 近似が正しくないのはなぜですか?

この方法論をテストするために、予想される 0.25 からかけ離れた値を選びました。

> af=c(0.001,0.200,1.0,0.5)
> chisq.test(af, p=p)

        Chi-squared test for given probabilities

data:  af
X-squared = 1.3325, df = 3, p-value = 0.7214

Warning message:
In chisq.test(af, p = p) : Chi-squared approximation may be incorrect

この場合、値が予想される 0.25 値からかなり離れていても、H0 はまだ拒否されません。

4

1 に答える 1

3
observed <- c(27,30,19,52)
chisq.test(observed)

これは、そのような頻度またはこれよりも極端な頻度が、約 0.03% の確率で偶然に発生することを示しています (p = 0.0003172)。

帰無仮説が 4 つのカテゴリ全体で 25:25:25:25 の分布ではなく、これらのデータが 3:3:1:9 の期待値から大幅に逸脱しているかどうかが問題である場合、期待される度数を明示的に計算する必要があります。 :

expected <- sum(observed)*c(3,3,1,9)/16

chisq.test(observed,p=c(3,3,1,9),rescale.p=TRUE)
于 2014-07-05T19:32:44.927 に答える