Python3を使用して「fastq」ファイルをタブ区切りファイルに変換しようとしています。入力は次のとおりです(1〜4行目は、タブ区切り形式で印刷する必要がある1つのレコードです)。ここでは、各レコードをリスト オブジェクトに読み込もうとしています。
@SEQ_ID
GATTTGGGGTT
+
!''*((((***
@SEQ_ID
GATTTGGGGTT
+
!''*((((***
これを使用して:
data = open('sample3.fq')
fq_record = data.read().replace('@', ',@').split(',')
for item in fq_record:
print(item.replace('\n', '\t').split('\t'))
出力は次のとおりです。
['']
['@SEQ_ID', 'GATTTGGGGTT', '+', "!''*((((***", '']
['@SEQ_ID', 'GATTTGGGGTT', '+', "!''*((((***", '', '']
出力の先頭に空白行が表示されますが、その理由がわかりません?? これは他の多くの方法で実行できることを認識していますが、Python を学習しているため、その理由を理解する必要があります。ありがとう