私はコーディングが初めてで、この質問を解決する方法を見つけようとしています: # で始まるすべてのヘッダーと、7 列目に "PASS" という単語がある行を見つけて、それらを new.vcf に出力します。パスは他の列に表示される場合がありますが、7 番目の列では単独ですべて大文字で表示されます。これらのファイルはタブ区切りです。質問の最初の部分は既に完了していますが、7 列目から「PASS」を引き出す方法がわかりません。これが私がこれまでに持っているコードの合計です。
#!/usr/bin/env python
myfile= open("temp.vcf","r")
outfile= open("new.vcf","w")
for data in myfile:
data = data.strip("\t")
if data[0] == "#":
outfile.write(data +"\n")
myfile.close()
outfile.close()
myfile=open("temp.vcf","r")
outfile=open("new.vcf","a")
data=myfile.readline()
while data == "PASS":
outfile.write(data+"/t")
data=myfile.readline()
myfile.close()
outfile.close()