1

Genbankいくつかのシーケンスを含むファイルがあります。これらのシーケンスの名前とそれらに関するその他の情報を含む 2 つ目のテキスト ファイルが TSV にあり、これを pandas データフレームとして読み込みます。n_name以下のコード ブロックに示すように、.sample 関数を使用して、このデータから名前をランダムに選択し、変数 を割り当てました。

n = df_bp_pos_2.sample(n = 1)
n_value = n.iloc[:2]
n_name = n.iloc[:1]

n_nameファイル内の Locus 名と同じで、genbank大文字と小文字が正確です。ファイルを解析して、genbankを持つシーケンスを抽出しようとしていますlocus = n_namegenbankファイルの名前はall.gb. 私は持っている:

from Bio import SeqIO
for seq_record in SeqIO.parse("all.gb", "genbank"):

しかし、遺伝子座で解析するには、次の行または2行がどうあるべきかよくわかりませんか? 何か案は?

4

1 に答える 1