1 つのコピー領域に 4 つの遺伝子型の観測カウントのサンプルがあります。私がやりたいことは、これらの遺伝子型の対立遺伝子頻度を計算し、これらの頻度のテストが、R のカイ 2 乗を使用して 25%:25%:25%:25% の期待値から大きく外れることです。
これまでのところ、私は得ました:
> a <- c(do.call(rbind, strsplit(as.character(gdr18[1,9]), ",")), as.character(gdr18[1,8]))
> a
[1] "27" "30" "19" "52"
次に、合計数を取得します。
> sum <- as.numeric(a[1]) + as.numeric(a[2]) + as.numeric(a[3]) + as.numeric(a[4])
> sum
[1] 128
現在の周波数:
> af1 <- as.numeric(a[1])/sum
> af2 <- as.numeric(a[2])/sum
> af3 <- as.numeric(a[3])/sum
> af4 <- as.numeric(a[4])/sum
> af1
[1] 0.2109375
> af2
[1] 0.234375
> af3
[1] 0.1484375
> af4
[1] 0.40625
ここで私は今迷っています。af1、af2、af3、af4 が 0.25、0.25、0.25、0.25 から大きく外れているかどうかを知りたい
Rでこれを行うにはどうすればよいですか?
ありがとう、エイドリアン
編集:
申し分なく、私は示唆されているように chisq.test() を試しています:
> p <- c(0.25,0.25,0.25,0.25)
> chisq.test(af, p=p)
Chi-squared test for given probabilities
data: af
X-squared = 0.146, df = 3, p-value = 0.9858
Warning message:
In chisq.test(af, p = p) : Chi-squared approximation may be incorrect
警告メッセージは何を伝えようとしていますか? 近似が正しくないのはなぜですか?
この方法論をテストするために、予想される 0.25 からかけ離れた値を選びました。
> af=c(0.001,0.200,1.0,0.5)
> chisq.test(af, p=p)
Chi-squared test for given probabilities
data: af
X-squared = 1.3325, df = 3, p-value = 0.7214
Warning message:
In chisq.test(af, p = p) : Chi-squared approximation may be incorrect
この場合、値が予想される 0.25 値からかなり離れていても、H0 はまだ拒否されません。