奇妙な質問かもしれませんが、ここに行きます:
ランダムな順序で読み取っているいくつかのログファイルを解析する必要があります。ソートされたものを処理するには、抽出されたログ時間でソートする必要があります。
ログエントリは次のようになります。
l = 2001:470:1f14:169:5000:eae0:589d:c211 - SOFT12 [14/Nov/2012:09:32:46 +0100] "POST /request HTTP/1.1" 200 984 "-" "-" 181446
私はこのように日付を抽出することができます:
l.split('+', 1)[0].split('-', 1)[1].split(' ')[2].split('[')[1]
それは私に与えます:
14/Nov/2012:09:32:46
1日あたり+200万レコードの数年分のログファイルを見ているので、フォーマットと並べ替えを切り替えるためだけに、何も日時オブジェクトに変換したくありません。14/Nov/2012
したがって、文字列の日付部分を並べ替え可能2012-11-14
、できれば上からの便利な分割ステートメントに含めることができる文字列のみの操作を探しています...
質問:
文字列-日付を日時オブジェクトに変換せずに変更するにはどうすればよいですか?