0

私は正規表現が苦手なので、これについて助けを求めています。

以下を除くすべてのhtmlタグを削除するための正規表現とは何か知りたいのですが。

  1. 大胆な
  2. イタリック
  3. 下線を引く
  4. 改行

みんなありがとう。あなたがこれで私を助けてくれることを願っています。

4

4 に答える 4

1

HTMLを解析する必要があると他の回答が考える理由がわかりません。一部のパターンを置き換えるだけで、他のパターンを置き換える必要はありません。したがって、正規表現の置換にコールバック関数を使用します...

var keep = {
    b: true,
    i: true,
    u: true,
    br: true
};

html.replace(/<\/?([a-z]+) ?[^>]*>/g, function(wholeMatch, tagName)
{
    if (keep[tagName]) {
        return wholeMatch;
    }

    return '';
});
于 2015-02-12T09:34:53.123 に答える
1

これとは別に冗談ですが、正規表現で HTML を解析しようとせず、HTML パーサーを使用してください。それはあなたの人生を楽にします。

「HTMLパーサー」+選択した言語について、何かをGoogleで検索するか、SOで検索してください。

于 2012-07-06T15:16:29.290 に答える
1

正規表現を空の文字列に置き換え、キャプチャなどのすべてのインクルード タグに<[]>.*?</[]> 収集します[]<[mas]>.*?</[mas]><m>anything</m> <a>anything</a> <s>anything</s>

于 2012-07-06T15:14:59.883 に答える