10 ~ 100k の要素を含むリストで、何百万もの要素 (20 ~ 30 文字の文字列) の存在を確認する必要があります。Pythonでそれを行うより速い方法はありset()
ますか?
import sys
#load ids
ids = set( x.strip() for x in open(idfile) )
for line in sys.stdin:
id=line.strip()
if id in ids:
#print fastq
print id
#update ids
ids.remove( id )