1

ペアエンド シーケンスの結果である、すべてのシーケンスがスタックされた fastq ファイルがあります。すべてのリバース シーケンスが 1 つのファイルにあり、フォワード シーケンスが 2 番目のファイルにあるように、それらを 2 つのファイルに分ける必要があります。そのため、最初の 4 行を読み取ってファイル "R" に書き込み、次の 4 行を読み取ってファイル "F" に書き込む必要があります。その後、次の行を同じ方法で読み取って保存する必要があります。こんなこと(下記)を考えたのですが、うまくいきませんでした。何か助けはありますか?お願いします。

R = open("R.fastq","w+")
F = open("F.fastq","w+")

x = raw_input('type the name of the file you wanna split: ')   
with open (x, 'rt') as myfile:   
    for line in myfile:
        R.write (line)
        R.write (line)
        R.write (line)
        R.write (line)
        F.write (line)
        F.write (line)
        F.write (line)
        F.write (line)

R.close()
F.close()
4

4 に答える 4

0

これは、インターリーブされた FASTQ の「インターリーブ解除」と呼ばれます。それをグーグルで検索すると、パッケージのreformatコマンドを含む、事前に作成されたソリューションがいくつでも見つかります。http://seqanswers.com/forums/showthread.php?t=46174BBmap/BBtools

于 2020-05-24T21:50:37.567 に答える