特定のエントリのデータが必要な巨大なファイルがあります。ファイル構造は次のとおりです。
>Entry1.1
#size=1688
704 1 1 1 4
979 2 2 2 0
1220 1 1 1 4
1309 1 1 1 4
1316 1 1 1 4
1372 1 1 1 4
1374 1 1 1 4
1576 1 1 1 4
>Entry2.1
#size=6251
6110 3 1.5 0 2
6129 2 2 2 2
6136 1 1 1 4
6142 3 3 3 2
6143 4 4 4 1
6150 1 1 1 4
6152 1 1 1 4
>Entry3.2
#size=1777
AND SO ON-----------
私が達成しなければならないことは、特定のエントリのすべての行 (完全なレコード) を抽出する必要があるということです。たとえば、エントリの名前「> Entry1.1」から次の「>」までをREGEXのマーカーとして使用して、その間の行を抽出できるよりも、Entry1.1のレコードが必要です。しかし、そのような複雑な REGEX 式を作成する方法がわかりません。このような式ができたら、FOR ループにします。
For entry in entrylist:
GET record from big_file
DO some processing
WRITE in result file
特定のエントリに対してそのようなレコードの抽出を実行するための REGEX は何でしょうか? これを達成するためのよりpythonicな方法はありますか? これについてあなたの助けをいただければ幸いです。
AK