バイオインフォマティクスは、用語が明確に定義されていて、簡単にアクセスできる主題ではないことにすぐに気付きました。私の結果のいくつかとは明らかな食い違いがあります。
samtools view -b -h -f 8 fileName.bam > mateUnmapped.bam
いくつかの BAM ファイルで使用しました。このコマンドは、パートナーがドラフトゲノムと一致しない読み取りのみを抽出するという印象を受けています (ヘッダーも含まれます。出力は BAM 形式です)。
結果のファイルでを使用するsamtools 'flagstat'
と、興味深い結果が得られます。「シングルトン」の数が読み取りの総数と一致しません...これは奇妙に思えます。
私が見つけることができる唯一の和解はここにあります:
http://seqanswers.com/forums/showthread.php?t=46711
このフォーラムで提起された質問に回答したある人は、シングルトンはパートナーをまったく読み取らないシーケンスとして定義されることがあると主張しています。しかし、それはまだ私の結果を説明していません。Flagstat によると、私の読み取りの約 40% はシングルトンですが、私が使用した「view」コマンドに基づくと、それらはすべてシングルトンである必要があります。
ベテランのバイオインフォマティシャンが私を助けてくれますか?