ログファイルを正規表現で区切られたブロックに分割する最も効率的な方法は何ですか?
ログファイルには複数のリクエスト/ブロックが含まれています (各ブロックの行数は可変です - メソッドなどによって異なります)
前のリクエスト/ブロックが終了したことを識別する唯一の方法は、EOF または別のリクエストの開始、つまり特定のメッセージによるものです。
この特定のメッセージの正規表現を使用して、ファイル全体を分割し、ブロックを取得して、それぞれを個別に解析したいと考えています。
ログファイルの構造:
START_A_NEW_BLOCK_1:
Lorem ipsum dolor sit amet, consectetur adipiscing elit
Lorem ipsum dolor sit amet, consectetur adipiscing elit
Lorem ipsum dolor sit amet, consectetur adipiscing elit
Lorem ipsum dolor sit amet, consectetur adipiscing elit
Lorem ipsum dolor sit amet, consectetur adipiscing elit
Lorem ipsum dolor sit amet, consectetur adipiscing elit
START_A_NEW_BLOCK_2:
Lorem ipsum dolor sit amet, consectetur adipiscing elit
Lorem ipsum dolor sit amet, consectetur adipiscing elit
Lorem ipsum dolor sit amet, consectetur adipiscing elit
Lorem ipsum dolor sit amet, consectetur adipiscing elit