4

</td>すべてのhtmlタグを削除するコードがいくつかありますが、タグとタグを除いてすべてのhtmlを削除したいです</tr>

これはどのように行うことができますか?

public string HtmlStrip( string input)
{
    input = Regex.Replace(input, "<input>(.|\n)*?</input>", "*");
    input = Regex.Replace(input, @"<xml>(.|\n)*?</xml>", "*"); // remove all <xml></xml> tags and anything inbetween.  
    return Regex.Replace(input, @"<(.|\n)*?>", "*"); // remove any tags but not there content "<p>bob<span> johnson</span></p>" becomes "bob johnson"
}
4

2 に答える 2

6

正規表現は、XML や HTML の解析には向いていません。HTML Agility Pack を見てみましょう

HTML アジリティ パック

于 2013-03-21T20:41:34.460 に答える