fastq 形式の読み取りをトリミングするためのツールはたくさん見つかりましたが、既に整列された読み取りをトリミングするために利用できるツールはありますか?
4 に答える
特にトリミングしようとしているシーケンスがアダプターシーケンスである場合は、読み取りを整列させた後に読み取りをトリミングすることを個人的に思いとどまらせます。
これらのアダプター配列が存在すると、読み取りがゲノムに適切にアラインされなくなります (私の経験からすると、アラインメントのパーセンテージははるかに低くなります)。アラインメントはすでに不正確であるため、アラインメント後にシーケンスをトリミングする (ガベージ イン、ガベージ アウト) ことはまったく無意味です。
fastq ファイルを調整する前にトリミングする方がはるかに良いでしょう。
1 つの可能性は、ClipReads などの GATK ツールセットを使用することです。アダプターを削除する場合は、ReadAdaptorTrimmer を使用できます。fastq への逆変換は不要です (ドキュメント : http://www.broadinstitute.org/gatk/gatkdocs/ )。
もちろん、ピカードは別の可能性です。
アラインメントがトリミング プロトコルに通知されるようにしたいですか、それとも品質値などをトリミングしたいですか? 1 つのアプローチは、単純に FASTQ に変換してから、利用可能な無数の従来のトリミング オプションのいずれかを使用することです。ピカードでこれを行うことができます:
http://picard.sourceforge.net/command-line-overview.shtml#SamToFastq