それぞれ約50行の長さの約5万個のファイルで探している800個の要素のリストがあります。(これらは一般的でない名前のxmlタグです-検索は簡単なので、Beautifulスープは使用していません。)
800個の要素のリストは、1つが見つかるたびに短縮されます。
ファイルを反復処理し、
私が最初に通過するのは重要ですか-すべての可能な要素に対して各行をチェックします(「スポット」、「ローバー」、「フィド」などの行をチェックします...)、または一度に1つの要素をチェックするすべての行を通過します(たとえば、ファイル内のすべての行で「スポット」をチェックしてから、すべての行で「ローバー」などをチェックします...)?
それとも、これはすべて一緒に非効率的ですか?(これはPythonを使用しています。)私は考えていました:
for line in somefile:
for element in somelist:
if re.search(element, line):
....
また:
for element in somelist:
for line in somefile:
if re.search(element, line):
....