3

これはsamtoolsmpileupの結果の一部です:

chr7    55241514        G       2786    .....................
chr7    55241515        C       2786    .....................
chr7    55241516        C       2786    .....................
chr7    55241517        G       2786    .....................
chr7    55241518        T       2786    .....................
chr7    55241519        G       2786    .$.$.$.$.$.$.$.$.$.$.
chr7    55241520        G       2776    .....................
chr7    55241521        C       2776    .....................
chr7    55241522        T       2776    .....................
chr7    55241523        G       2774    .....................
chr7    55241524        C       2774    .....................
chr7    55241525        T       2774    .....................
chr7    55241526        G       2723    .....................
chr7    55241527        G       2723    .$.$.$.$.$.$.$.$.$.$.
chr7    55241609        C       7999    ......^F.^F.^F.^F.^F.
chr7    55241610        C       7999    .....................
chr7    55241611        C       7999    .....................
chr7    55241612        A       7999    .....................
chr7    55241613        G       7999    .....................
chr7    55241614        C       7999    .....................
chr7    55241615        T       7999    .....................
chr7    55241616        T       7999    .....................

「^F」の意味がわかりません。mpileupの司令官の助けを借りて調べました。記号「^」は読み取りの開始を示します。'^'から33を引いた文字のASCIIは、マッピング品質を示します。記号「$」は、読み取りセグメントの終わりを示します。「F」については何も言われていませんが、この結果の「F」の意味を誰かが知っていますか。

4

2 に答える 2

1

fastq形式へようこそ。ASCIIテーブルを使用すると、「F」の10進値が70であることがわかります。したがって、「F」に関連付けられた品質スコアは70〜33であり、37になります。

イルミナ1.8+エンコーディングのデータセットを使用してパイルアップが生成されたとすると、品質スコアの範囲は0〜41になります。したがって、37はその位置の非常に高い品質スコアです。メモリから:

40 would give a base call accuracy of 99.99%
30 would give a base call accuracy of 99.90%
20 would give a base call accuracy of 99.00%
10 would give a base call accuracy of 90.00%
 0 would give a base call accuracy of 00.00%
于 2012-10-14T08:36:12.510 に答える
0

あなたはほとんど自分で答えを見つけました:

...記号「^」は読み取りの開始を示します。'^'から33を引いた文字のASCIIは、マッピング品質を示します。

したがって、「F」は、その位置から始まる1つの読み取りのマッピング品質をエンコードします(代わりに、Steveが基本呼び出し品質について話していると思います)。品質は、phredスコア、つまりログスケールのエラー確率です:P = 10 ^(-Q / 10)。ASCIIテーブル(man asciiなど)をチェックして33を引くことにより、品質の数値を導き出すことができます。Fは70に変換され、マッピング品質は37になります。マッピング品質の定義はアライナごとに異なりますが、理論的にはこれは次のことを意味します。その列から始まるその1つの読み取りのミスアライメントの10^(-37/10)= 0.01%の可能性があること。

アンドレアス

于 2012-10-14T11:19:58.040 に答える