仕事用のメールのデータ ダンプがテキスト ファイルにあり、正規表現を使用してメールの内容を抽出したいと考えています。
現時点では、元の要求者をデータから削除しようとしています。電子メールの元の作成者は常に自分の名前に対してタイム スタンプを持っていますが、cc された人はそうではありません。
本質的に、メールは次のようになります
ジョン・スミス (XYZ RE) (M/DD/YYYY HH:MM PM):
John Smith (XYZ RE) の電子メール形式は、別の人物の電子メールのさらに下に再び表示されます。
メールを取得するためにこの洗練されていない正規表現を作成しました(機能するので、十分に満足しており、どちらがより重要であるかを理解しています)
([^\s]+\s+[^\s]+\s+[(]+[A-Z]+\s+[A-Z]+[)])
日付を取得するために同様のことも試しましたが、これは一部の日付では機能し、他の日付では失敗します
([^\s][0-9]+[/]+[0-9]+[/]+[0-9]+\s+[0-9][:][0-9]+\s+(AM|PM)[)][:])
誰でも助けることができますか?
私は正規表現の初心者であり、時間があればメモ帳++を使用してテストし、Javaベースのアプリケーションを使用して実行する場合は、ウォークスルーもいただければ幸いです
ありがとうジョン