それで、これが私が解析したい電子メールのサンプルであり、その本文だけを抽出します。
RECEIVED: 2012-11 20 09:59:24
SUBJECT: Get Boddy
--- Original Sender: Mark Twain. ---
----- Original Message -----
From: Boby Indo
To: Obum Hunter
At: 11/20 9:59:22
***NEW ISSUE SUPPORTED THROUGH UNIVERSALITY vs 104-13 on AY 3s JAN
10+BB {MYXV ABC 4116 SM MYXV YA 102-15 <DO>} | 2010/11 4.0s 4.0s
6+ BB {MYXV ABC 4132 NS MYXV YT 102-22 <DO>} | 2010 4.5s 4.5s
ABO 2006-OP1 M1 00442PAG5 19-24 p5
***SECOND SUPPORTED TRHOUGH INVERSALITY GEVINGS
10+BB {NXTW VXA 4061 SL MYXV YA 103-22 <DO>} | 11 wala 3.5s 3.5s
10+BB {NXTW VXA 12-47 SP MYXV YA 106-20 <DO>} | 22 wala 4.0s 4.0s
------------------------------------------------------------
© Copyright 2012 The Ridgly Group, Inc. All rights reserved. See
http://www.examply.html for important information disclosure.
これが私が期待することです:
***NEW ISSUE SUPPORTED THROUGH UNIVERSALITY vs 104-13 on AY 3s JAN
10+BB {MYXV ABC 4116 SM MYXV YA 102-15 <DO>} | 2010/11 4.0s 4.0s
6+ BB {MYXV ABC 4132 NS MYXV YT 102-22 <DO>} | 2010 4.5s 4.5s
ABO 2006-OP1 M1 00442PAG5 19-24 p5
***SECOND SUPPORTED TRHOUGH INVERSALITY GEVINGS
10+BB {NXTW VXA 4061 SL MYXV YA 103-22 <DO>} | 11 wala 3.5s 3.5s
10+BB {NXTW VXA 12-47 SP MYXV YA 106-20 <DO>} | 22 wala 4.0s 4.0s
***
線も削除できればいいのにと思います。
そして、これが私がこれまでに得たもの(?P<header>[\S+\s]+At:.*)\n+(?P<body>[\S+\s]([\d\.\d]+[a-z]?$))
です。これは、最後の4.0の後に破線をつかみ、非ASCII文字でスタックするため、うまく機能していないようです©
。ありがとう!
PS:最善のアプローチは、グループを含む電子メールのヘッダーとテールをカットオフすることだと思います。ですから、残っているのは体です。ヘッダーとテールは常に同じままですが、本文は異なる電子メールで変更されるためです。解決策は、電子メールに固有のものである必要はありません。