biopython を使用して genbank ファイルに 70000 以上の新機能を追加しようとしています。
私はこのコードを持っています:
from Bio import SeqIO
from Bio.SeqFeature import SeqFeature, FeatureLocation
fi = "myoriginal.gbk"
fo = "mynewfile.gbk"
for result in results:
start = 0
end = 0
result = result.split("\t")
start = int(result[0])
end = int(result[1])
for record in SeqIO.parse(original, "gb"):
record.features.append(SeqFeature(FeatureLocation(start, end), type = "misc_feat"))
SeqIO.write(record, fo, "gb")
結果は、元の gbk ファイルに追加する必要がある各機能の開始点と終了点を含むリストの単なるリストです。
このソリューションは私のコンピューターにとって非常にコストがかかり、パフォーマンスを改善する方法がわかりません。何か良いアイデアはありますか?