このジェネレーター関数は、IDと、outメッセージとinメッセージのタイムスタンプの違いを含むタプルを返します。(時差を使ってもっと複雑なことをしたい場合は、チェックしてくださいdatetime.timedelta
)。これは、outメッセージが常にメッセージの前に表示されることを前提としていることに注意してください。
def get_time_deltas(infile):
entries = (line.split() for line in open(INFILE, "r"))
ts = {}
for e in entries:
if len(e) == 11 and " ".join(e[2:5]) == "TMsg out: [O]":
ts[e[8]] = e[0] # store timestamp for id
elif len(e) == 10 and " ".join(e[2:5]) == "TMsg in: [A]":
in_ts, ref_id = e[0], e[9]
# Raises KeyError if out msg not seen yet. Handle if required.
out_ts = ts.pop(ref_id) # get ts for this id
yield (ref_id[1:-1], float(in_ts) - float(out_ts))
これで、リストを取得できます。
>>> INFILE = 'C:/Users/kdalton/Documents/Minicomm.txt'
>>> list(get_time_deltas(INFILE))
[('123', 8.699999307282269e-05), ('1233', 0.00028700000257231295)]
または、ファイルに書き込みます。
>>> with open("out.txt", "w") as outfile:
... for id, td in get_time_deltas(INFILE):
... outfile.write("Msg %s took %f seconds\n", (id, td))
または、より複雑なワークフローにチェーンします。
アップデート:
(実際のデータを見て)
代わりにこれを試してください:
def get_time_deltas(infile):
entries = (line.split() for line in open(INFILE, "r"))
ts = {}
for e in entries:
if " ".join(e[2:5]) == "OuchMsg out: [O]":
ts[e[8]] = e[0] # store timestamp for id
elif " ".join(e[2:5]) == "OuchMsg in: [A]":
in_ts, ref_id = e[0], e[7]
out_ts = ts.pop(ref_id, None) # get ts for this id
# TODO: handle case where out_ts = None (no id found)
yield (ref_id[1:-1], float(in_ts) - float(out_ts))
INFILE = 'C:/Users/kdalton/Documents/Minicomm.txt'
print list(get_time_deltas(INFILE))
このバージョンでの変更点:
- フィールドの数は、問題の投稿されたサンプル入力に記載されているものとは異なります。エントリ番号に基づいてチェックを削除しました
ordID
メッセージの場合は、メッセージin
で一致するものrefID
ですout
OuchMsg
代わりに使用TMsg
アップデート2
デルタの平均を取得するには:
deltas = [d for _, d in get_time_deltas(INFILE)]
average = sum(deltas) / len(deltas)
または、以前にすべてのデータを含むリストを生成したことがある場合は、ファイルを再解析する代わりにそれを再利用できます。
data = list(get_time_deltas(INFILE))
# .. use data for something some operation ...
# calculate average using the list
average = sum(d for _, d in data) / len(data)