NCBI (GenBank(full) 形式) から完全なゲノム配列のみをダウンロードする必要があります。「全ゲノム」ではなく「完全ゲノム」に興味があります。
私のスクリプト:
from Bio import Entrez
Entrez.email = "asiakXX@wp.pl"
gatunek='Escherichia[ORGN]'
handle = Entrez.esearch(db='nucleotide',
term=gatunek, property='complete genome' )#title='complete genome[title]')
result = Entrez.read(handle)
結果として、サイズが約 484 bp のゲノムの小さなフラグメントのみが得られます。
LOCUS NZ_KE350773 484 bp DNA linear CON 23-AUG-2013
DEFINITION Escherichia coli E1777 genomic scaffold scaffold9_G, whole genome
shotgun sequence.
NCBI Web サイトを介して手動で行う方法は知っていますが、非常に時間がかかるため、そこで使用するクエリは次のとおりです。
escherichia[orgn] AND complete genome[title]
その結果、サイズ範囲が約 5,154,862 bp の複数のゲノムが得られました。これは、ENTREZ.esearch を介して行う必要があることです。