私は正規表現が苦手なので、これについて助けを求めています。
以下を除くすべてのhtmlタグを削除するための正規表現とは何か知りたいのですが。
- 大胆な
- イタリック
- 下線を引く
- 改行
みんなありがとう。あなたがこれで私を助けてくれることを願っています。
私は正規表現が苦手なので、これについて助けを求めています。
以下を除くすべてのhtmlタグを削除するための正規表現とは何か知りたいのですが。
みんなありがとう。あなたがこれで私を助けてくれることを願っています。
HTMLを解析する必要があると他の回答が考える理由がわかりません。一部のパターンを置き換えるだけで、他のパターンを置き換える必要はありません。したがって、正規表現の置換にコールバック関数を使用します...
var keep = {
b: true,
i: true,
u: true,
br: true
};
html.replace(/<\/?([a-z]+) ?[^>]*>/g, function(wholeMatch, tagName)
{
if (keep[tagName]) {
return wholeMatch;
}
return '';
});
これとは別に冗談ですが、正規表現で HTML を解析しようとせず、HTML パーサーを使用してください。それはあなたの人生を楽にします。
「HTMLパーサー」+選択した言語について、何かをGoogleで検索するか、SOで検索してください。
正規表現を空の文字列に置き換え、キャプチャなどのすべてのインクルード タグに<[]>.*?</[]>
収集します[]
<[mas]>.*?</[mas]>
<m>anything</m>
<a>anything</a>
<s>anything</s>