2 つのファイルを何百万回も繰り返し処理し、ファイル全体で単語のペアが出現する回数を数えます。(Fisher's Exact Test スコアを計算するための 2 つの単語の分割表を作成するため)
私は現在使用しています
from itertools import izip
src=tuple(open('src.txt','r'))
tgt=tuple(open('tgt.txt','r'))
w1count=0
w2count=0
w1='someword'
w2='anotherword'
for x,y in izip(src,tgt):
if w1 in x:
w1count+=1
if w2 in y:
w2count+=1
.....
これは悪くありませんが、2 つのファイルを反復処理するより高速な方法があるかどうかを知りたいです。
よろしくお願いします。