Genbank
いくつかのシーケンスを含むファイルがあります。これらのシーケンスの名前とそれらに関するその他の情報を含む 2 つ目のテキスト ファイルが TSV にあり、これを pandas データフレームとして読み込みます。n_name
以下のコード ブロックに示すように、.sample 関数を使用して、このデータから名前をランダムに選択し、変数 を割り当てました。
n = df_bp_pos_2.sample(n = 1)
n_value = n.iloc[:2]
n_name = n.iloc[:1]
n_name
ファイル内の Locus 名と同じで、genbank
大文字と小文字が正確です。ファイルを解析して、genbank
を持つシーケンスを抽出しようとしていますlocus = n_name
。genbank
ファイルの名前はall.gb
. 私は持っている:
from Bio import SeqIO
for seq_record in SeqIO.parse("all.gb", "genbank"):
しかし、遺伝子座で解析するには、次の行または2行がどうあるべきかよくわかりませんか? 何か案は?