わかりました-これは、正規表現に関する私の限られた知識をはるかに超えています。銀行から、固定のテキストファイル形式でレポートを受け取ります。残念ながら、彼らのシステムは、私たちの側で処理する前に削除する必要があるデータファイルを含むページヘッダーをエクスポートします。ページヘッダーは同じテキストで開始および終了しますが、コンテンツが変更されます(日付とページ番号)。典型的なものは次のようになります。
00007xxxxx LAST1,FIRST1 111111 20120930
ABCD EXPORT RPT 10/04/12 at 10/04/12 16:20 Seq 1501 Page 16
MRK014 Report Date: 10/04/12
Acct# Name SH. Balance QTR (YYYYMMDD)
----------------------------------------------------------------------------------------------------
00007xxxxx LAST2,FIRST2 222222 20120930
したがって、各ヘッダーは「ABCD」(実際には銀行の名前であり、プライバシーのためにここで削除されています)で始まり、-------------------の行で終わります。
私が理解する必要があるのは、2行の顧客データです(00007xxxxx-これらのアカウント番号は1人あたり変更されます)。
したがって、「ABCD」から「---」の末尾までを選択して、そのテキストブロックを削除する必要があります。