0

私は以下のような文字列を持っています-

"This is <h2>a place/h2>
<p>You know its a good place!</p>
<ul>
    <li>Booked your ticket #20130114074912_AN3P703C on Monday, January 14</li>
</ul>"

だから、私は私の文字列を次のようにしたいと思います

"This is a place
You know its a good place.
Booked your ticket #20130114074912_AN3P703C on Monday, January 14"
4

5 に答える 5

2

これがあなたの答えだと思います。リンク

これを試して:

// <summary>
/// Remove HTML from string with Regex.
/// </summary>
public static string StripTagsRegex(string source)
{
   return Regex.Replace(source, "<.*?>", string.Empty);
}

出力:

Input:    <p>The <b>dog</b> is <i>cute</i>.</p>
Output:   The dog is cute.
于 2013-01-30T09:49:18.907 に答える
0

次の方法を使用して、任意の文字列からHTMLタグを削除できます

static string StripHTML (string inputString)
{
  return Regex.Replace(inputString, "<.*?>", string.Empty);
}
于 2013-01-30T09:52:29.533 に答える
0

HTML Agility Packをダウンロードして参照してから、次のように呼び出します。

var htmlDoc = new HtmlDocument();
htmlDoc.LoadHtml(input);
string output = htmlDoc.DocumentNode.InnerText;

これでも不正な形式の/h2>タグは削除されませんが、正規表現よりもはるかに多くのHTMLを処理する必要があります。

于 2013-01-30T10:00:02.697 に答える
0

これはトリックを行う必要があります

string input = "This is <h2> a place</h2><p>You know its a good place!</p><ul>    <li>Booked your ticket #20130114074912_AN3P703C on Monday, January 14</li></ul>";
input = Regex.Replace(input, "<.*?>", string.Empty);

これにより、「<>」で囲まれたすべての文字列が検索され、「」または空の文字列に置き換えられます

于 2013-01-30T10:09:36.493 に答える
0

これはあなたの場合の仕事をします

String neededString = Regex.Replace(source, "<.*?>", string.Empty);

CSSを含むより複雑な文字列の場合、JavaScriptノードuは次を使用できます

String neededStringRegex.Replace(subjectString, @"<(style|script)[^<>]*>.*?</\1>|</?[a-z][a-z0-9]*[^<>]*>|<!--.*?-->", "")
于 2013-01-30T09:54:45.420 に答える