PCR 増幅プロセス中に塩基のミスマッチが発生する可能性のある DNA アンプリコンがあります。私の興味は、塩基あたりのエラー率、ミスマッチの数、およびアンプリコンの塩基数を考慮して、シーケンスにエラーが含まれる確率はどのくらいかということです。
[Cummings, SM et al (2010)]という記事に出くわしました。集団遺伝子解析における PCR、クローニング、シーケンシング エラーのソリューション。保全遺伝学、11(3)、1095–1097。doi:10.1007/s10592-009-9864-6] は、このような場合に確率質量関数を計算する式を提案しています。
ここに示すように、Rを使用して式を実装しました
pcr.prob <- function(k,N,eps){
v = numeric(k)
for(i in 1:k) {
v[i] = choose(N,k-i) * (eps^(k-i)) * (1 - eps)^(N-(k-i))
}
1 - sum(v)
}
この記事から、30 サイクルの PCR を使用して 800 bp のアンプリコンを分析し、1.85e10-5
1 サイクルあたり 1 塩基あたりの誤取り込みを行い、最も類似した配列とは異なる10
各 bp のユニークな配列を発見したことを示唆しています。3
3 つの独立した PCR エラーによって新しい配列が生成される確率は に等しくなりP = 0.0011
ます。
ただし、数式の実装を使用すると、別の値が得られます。
pcr.prob(3,800,0.0000185)
[1] 5.323567e-07
実装で何が間違っている可能性がありますか? 私は何かを誤解していますか?
ありがとう