私は電子メールを検証していません。私がやりたいことは、(html)文字列で3つの異なるタイプの「電子メール」コンテンツを見つける(そして変更する)ことです:
- 普通の電子メール: 例: user@test.com
- mailto href: 例
<a href="mailto:user@test.com">user@test.com</a>
- エイリアス化された href: 例
<a href="mailto:user@test.com">user's email</a>
次に、各例をカスタム html 文字列に変換します。この文字列は、JS によって変更されます (Spamspan によるアンチスパム ハーベスティング)。
<span class="spamspan">
<span class="u">user</span>
@
<span class="d">example.com</span>
(<span class="t">Spam Hater</span>)
</span>
したがって、これらのタイプの入力を見つけて、電子メールをユーザー、ドメイン、および (オプションで) 表示値に解析する必要があることがわかります。私は現在、正規表現でこれらのメールを見つけるのに苦労しています...それらを解析することはPHPで簡単にできるはずです。
編集: 現在、私は PHP4 にロックされています。HTML の解析については、 http://php-html.sourceforge.net/を参照してください。