1

数十万行のログ ファイルがあります。

これらの行をループして、次のような特定のテキストを含む行を見つけます!!event!!
次に、行が見つかったら、独自の特定のテキストを含む次の 3 行が見つかるまで!!event!!、この行の後もループし続ける必要があります。 3 行目を見つけたら、次の行をループし続け、イベントがなくなるまで前のプロセスを繰り返します。 !!event!!('flag1', 'flag2', and 'flag3')
('flag3')!!event!!

これを達成するためにコードを構成する方法について誰か提案がありますか?

例えば:

f = open('samplefile.log','r')
for line in f:
    if '!!event!!' in line:
            L0 = line
        #then get the lines after L0 containing: 'flag1', 'flag2', and 'flag3'
        # below is a sample log file  
        #I am not sure how to accomplish this 
        #(I am thinking a loop within the current loop) 
        #I know the following is incorrect, but the 
         intended result would be able to yield something like this:
            if "flag1" in line:
                L1 = line.split()
            if "flag2" in line:
                L2 = line.split()
            if "flag3" in line:
                L3 = line.split()
print 'Event and flag times: ', L0[0], L1[0], L2[0], L3[0]

samplefile.log

8:41:05 asdfa   32423
8:41:06 dasd    23423
8:41:07 dfsd    342342
8:41:08 !!event!!   23423
8:41:09 asdfs   2342
8:41:10 asdfas  flag1
8:41:11 asda    42342
8:41:12 sdfs    flag2
8:41:13 sdafsd  2342
8:41:14 asda    3443
8:41:15 sdfs    2323
8:41:16 sdafsd  flag3
8:41:17 asda    2342
8:41:18 sdfs    3443
8:41:19 sdafsd  2342
8:41:20 asda    3443
8:41:21 sdfs    4544
8:41:22 !!event!!   5645
8:41:23 sdfs    flag1
8:41:24 sadfs   flag2
8:41:25 dsadf   32423
8:41:26 sdfa    23423
8:41:27 sdfsa   flag3
8:41:28 sadfa   23423
8:41:29 sdfas   2342
8:41:30 dfsdf   2342

このサンプルのコードは次のように表示されます。

Event and flag times: 8:41:08 8:41:10 8:41:12 8:41:16
Event and flag times: 8:41:22 8:41:23 8:41:24 8:41:27
4

5 に答える 5

3

確かに、内側のループでファイルを消費し続け、flag3 に遭遇したときにファイルを抜け出すことができ、外側のループが再開されます。

for line in f:
    if '!!event!!' in line:
        L0 = line.split()
        for line in f:
            if "flag1" in line:
                L1 = line.split()
            elif "flag2" in line:
                L2 = line.split()
            elif "flag3" in line:
                L3 = line.split()
                break             # continue outer loop
        print 'Event and flag times: ', L0[0], L1[0], L2[0], L3[0]

# Event and flag times:  8:41:08 8:41:10 8:41:12 8:41:16
# Event and flag times:  8:41:22 8:41:23 8:41:24 8:41:27
于 2013-03-14T15:33:51.667 に答える
0

どうぞ:

with open("in6.txt") as f:
    flag = False
    c = 0
    d = []
    data = []
    for line in f:
        if flag:
            if "flag1" in line or "flag2" in line:
                data.append(line.split()[0])
            elif "flag3" in line:
                data.append(line.split()[0])
                flag = False
                d.append(data)

            continue
        if "!!event!!" in line:
            flag = True
            data = []
            c = 0
            data.append(line.split()[0])

for l in d:
    print "Event and flag times: ", l[0], l[1], l[2], l[3]

出力

>>> 
Event and flag times:  8:41:08 8:41:10 8:41:12 8:41:16
Event and flag times:  8:41:22 8:41:23 8:41:24 8:41:27
于 2013-03-14T15:29:05.507 に答える
0

あなたが探しているものを追跡するためにフラグを立ててください:

with open('samplefile.log') as f:
    events = []
    current_event = []
    for line in f:
        if not current_event and '!!event!!' in line:
            current_event.append(line.split()[0])
        else:
            if 'flag1' in line or 'flag2' in line or 'flag3' in line:
                current_event.append(line.split()[0])
                if 'flag3' in line:  # could also be `if len(current_event) == 4:`
                    events.append(current_event)
                    current_event = []

for event in events:
    print 'Event and flag times:', ' '.join(event)

ここでcurrent_eventはフラグとして使用しました。行時間を追加する!!event!!と空ではなくなり、フラグを探し始めます。

個々のイベント時間をリストにまとめましたが、行eventsが見つかったときにイベント データを印刷することもできますflag3

出力:

Event and flag times: 8:41:08 8:41:10 8:41:12 8:41:16
Event and flag times: 8:41:22 8:41:23 8:41:24 8:41:27
于 2013-03-14T15:34:22.623 に答える
0

各行をループするだけで、!!event!!が見つかったらフラグを探し始め、すべてのフラグが見つかったら続行します...

何かのようなもの:

def get_time(line):
    return [ i for i in line.split() if i != ''][0]

data = []
index = -1
look_for_flags = False
for line in lines:
    if '!!event!!' in line:
        look_for_flags = True
        data.append([get_time(line)])
        index += 1
    elif look_for_flags:
        if 'flag1' in line or 'flag2' in line or 'flag3' in line:
            data[index].append(get_time(line))
print data
于 2013-03-14T15:41:22.167 に答える
0

これを行う最も明確な方法はgenerator function、を使用することです。これにより、状態を保持する必要がなくなります。ステート マシンを構築する必要があるときはいつでも (ここで行っているように)、考えてみてくださいgenerator

import sys

def find_target_lines(file_handle):
    target = yield
    for line in file_handle:
        if target in line:
            target = yield line

f = open('samplefile.log','r')
targets = ['!!event!!', 'flag1', 'flag2', 'flag3']

while True:
    found = list()
    finder = find_target_lines(f)
    next(finder)
    try:
        for target in targets:
            line = finder.send(target)
            if line:
                found.append(line)
        print(found)
    except StopIteration:
        break
于 2013-03-14T16:04:46.257 に答える