170

すべての HTML タグまたは文字列から関連する HTML をすべて削除する簡単な方法はありますか?

例えば:

string title = "<b> Hulk Hogan's Celebrity Championship Wrestling &nbsp;&nbsp;&nbsp;<font color=\"#228b22\">[Proj # 206010]</font></b>&nbsp;&nbsp;&nbsp; (Reality Series, &nbsp;)"

上記は実際には次のようになります。

「ハルク・ホーガンのセレブリティ・チャンピオンシップ・レスリング [プロジェクト番号 206010] (リアリティ シリーズ)」

4

3 に答える 3

76

Html Agility パックを使用して文字列を解析し、InnerText を取得できます。

    HtmlDocument htmlDoc = new HtmlDocument();
    htmlDoc.LoadHtml(@"<b> Hulk Hogan's Celebrity Championship Wrestling &nbsp;&nbsp;&nbsp;<font color=\"#228b22\">[Proj # 206010]</font></b>&nbsp;&nbsp;&nbsp; (Reality Series, &nbsp;)");
    string result = htmlDoc.DocumentNode.InnerText;
于 2013-08-09T19:21:52.887 に答える
5

以下のコードを文字列で使用すると、html 部分のない完全な文字列を取得できます。

string title = "<b> Hulk Hogan's Celebrity Championship Wrestling &nbsp;&nbsp;&nbsp;<font color=\"#228b22\">[Proj # 206010]</font></b>&nbsp;&nbsp;&nbsp; (Reality Series, &nbsp;)".Replace("&nbsp;",string.Empty);            
        string s = Regex.Replace(title, "<.*?>", String.Empty);
于 2013-08-09T20:50:13.697 に答える