こんにちは私はRegExを使用して、ログファイルを後でデータベースに入るグループに分割しようとしています。何らかの理由で、最後のグループに文字列の最後の単語を改行文字で含めることができません。
解析しているログファイルは次のようになります。
12:00:01 GRP this is a test1
12:02:03 TES here something else has happend
12:32:22 MCH This processe is finished
それらを3つのグループにグループ化したい
Time
3-letter code
Text
現在Pythonで私はこれを使用しています:
def parse (s):
mO = re.search ('([0-9][0-9]:[0-9][0-9]:[0-9][0-9]) (\w*) (\w.+) ',s)
if mO:
print "1: "+mO.group(1)
print "2: "+mO.group(2)
print "3: "+mO.group(3)
私が得る結果は次のとおりです。
1: 12:00:01
2: GRP
3: this is a
1: 12:02:03
2: TES
3: here something else has
1: 12:32:22
2: MCH
3: This processe is
改行が付加されている文字列の最後の単語が常に欠落しています。すべてのバリエーションで\n\ rを追加しようとしましたが、1日の検索で完全に失われました。
どんな助けでも大歓迎です。