3

Apache ログをアクセス可能なオブジェクトに解析しようとしている最初の python スクリプトに座っていますが、それを機能させることができません。

この例 (実行中)を使用しようとしてPython 2.7いますが、単一のログ エントリで動作するようにしたいだけです。

ここに私が持っているものがあります:

import re
from collections import namedtuple

format_pat= re.compile( 
    r"(?P<host>[\d\.]+)\s" 
    r"(?P<identity>\S*)\s" 
    r"(?P<user>\S*)\s"
    r"\[(?P<time>.*?)\]\s"
    r'"(?P<request>.*?)"\s'
    r"(?P<status>\d+)\s"
    r"(?P<bytes>\S*)\s"
    r'"(?P<referer>.*?)"\s'
    r'"(?P<user_agent>.*?)"\s*' 
)

Access = namedtuple('Access',
    ['host', 'identity', 'user', 'time', 'request',
    'status', 'bytes', 'referer', 'user_agent'] )

# my entry
log = '2001:470:1f14:169:15f3:824f:8a61:7b59 - ABC-15414 [14/Nov/2012:09:32:31 +0100] "POST /setConnectionXml HTTP/1.1" 200 4 "-" "-" 102356'

match= format_pat.match(log) 
print match

if match:
   Access( **match.groupdict() )
   print Access

何が間違っているのかわかりませんが、期待していたオブジェクトの代わりに をmatch返します。none

誰かが私にヒントを与えることができますか?

4

2 に答える 2

5

あなたのhostエントリは数字とドット (IPv4 アドレス) のみに一致しますが、投稿したログ エントリの例は IPv6 アドレスです。パターンを調整して、その形式も使用できるようにします (したがって、数字とドットに一致させるか、16 進文字とコロンに一致させます。

format_pat= re.compile( 
    r"(?P<host>(?:[\d\.]|[\da-fA-F:])+)\s" 
    r"(?P<identity>\S*)\s" 
    r"(?P<user>\S*)\s"
    r"\[(?P<time>.*?)\]\s"
    r'"(?P<request>.*?)"\s'
    r"(?P<status>\d+)\s"
    r"(?P<bytes>\S*)\s"
    r'"(?P<referer>.*?)"\s'
    r'"(?P<user_agent>.*?)"\s*' 
)

その調整により、あなたの例は次のように一致します。

>>> format_pat.match(log).groupdict()
{'status': '200', 'bytes': '4', 'request': 'POST /setConnectionXml HTTP/1.1', 'host': '2001:470:1f14:169:15f3:824f:8a61:7b59', 'referer': '-', 'user': 'ABC-15414', 'time': '14/Nov/2012:09:32:31 +0100', 'identity': '-', 'user_agent': '-'}
于 2013-03-05T14:20:13.187 に答える
1

使用する必要がありますformat_pat.search(log)

In [6]: m = format_pat.search(log)

In [7]: m.groupdict()
Out[7]: 
{'bytes': '4',
 'host': '59',
 'identity': '-',
 'referer': '-',
 'request': 'POST /setConnectionXml HTTP/1.1',
 'status': '200',
 'time': '14/Nov/2012:09:32:31 +0100',
 'user': 'ABC-15414',
 'user_agent': '-'}
于 2013-03-05T14:14:51.427 に答える