0

正規表現を使用すると、完全にレンダリングされた HTML ページ内のすべてのメールアドレスを見つけて置き換える必要があります。これは、それらすべてをスパムから保護したいからです。正確に言うと、フォーミュラー要素でそれらを除くすべてのアドレスが必要です (ユーザー入力の検証が失敗した場合でも、置換されたメールアドレスではなく、挿入されたメールアドレスを表示したいため)。

メールアドレスを検索するだけの正規表現を見つけたり書いたりすることは問題ではありません。問題は、式要素の除外です。この問題を解決する方法を提案している人はいますか? これは正規表現で可能ですか?

いくつかの例: 「...My content, mail@mail.com, more content......」に一致させたいが、「...Your mail:mail@mail.com」には一致させたくない...」

HTML を解析して単純にフォーム要素をスキップするほうがよいことはわかっていますが、パフォーマンスは重要であり、前に述べたように、このタスクは Web サイトが呼び出されるたびに実行されます...

ご協力いただきありがとうございます!

4

1 に答える 1

0

それはおそらく不可能です。参照: XHTML の自己完結型タグを除く RegExは開始タグに一致します。2 番目の正規表現は、「not」をうまく処理できません。(一部の正規表現はそれをサポートし、一部はサポートしていませんが、すべてが遅いです。) おそらく、私よりも正規表現が得意な人があなたを助けることができるかもしれませんが、これを行うことは不可能だと思います.

于 2012-08-27T09:06:16.430 に答える