ファイルに保存されている 2 つのタグの間のコンテンツを読み込もうとしています。コンテンツが複数行にまたがっている可能性があります。タグは、ファイル内で 0 回または 1 回発生します。
例: ファイルの内容は次のとおりです。
title:Corruption Today: Corruption today in
content:Corruption Today:
Corruption today in
score:0.91750675
したがって、 "Content:" を読んでいる間、私のクエリは "Corruption Today: Corruption today in" という結果になるはずです。グーグルで調べた後、次のコードを書くことができます
myfile = open(files,'r');
filecontent = myfile.read();
startPtrs = [m.start()+8 for m in re.finditer('content:', filecontent)];
startPtr = startPtrs[0];
endPtrs = [m.start()-1 for m in re.finditer('score:', filecontent)];
endPtr = endPtrs[0];
content = filecontent[startPtr:endPtr];
コンテンツを取得するために filecontent を 2 回繰り返しているため、上記のコードがどれほど効率的かはわかりません。より効率的な何かを行うことができますか。