0

MS Wordからいくつかのテキストフィールドが貼り付けられたDBがあり、タグとタグだけを削除するのに問題がありますが、明らかにそれらのinnerTextは保持されています。

HAPを使用してみましたが、正しい方向に進んでいません。

Public Function StripHtml(ByVal html As String, ByVal allowHarmlessTags As Boolean) As String
    Dim htmlDoc As New HtmlDocument()
    htmlDoc.LoadHtml(html)
    Dim invalidNodes As HtmlNodeCollection = htmlDoc.DocumentNode.SelectNodes("//div|//font|//span")
    For Each node In invalidNodes
        node.ParentNode.RemoveChild(node, False)
    Next
    Return htmlDoc.DocumentNode.WriteTo()
End Function

このコードは、必要な要素を選択して削除するだけですが、内部テキストは保持しません。

前もって感謝します

4

1 に答える 1

1

まあ...私は解決策を見つけたと思います:

Public Function StripHtml(ByVal html As String) As String
    Dim htmlDoc As New HtmlDocument()
    htmlDoc.LoadHtml(html)
    Dim invalidNodes As HtmlNodeCollection = htmlDoc.DocumentNode.SelectNodes("//div|//font|//span|//p")
    For Each node In invalidNodes
        node.ParentNode.RemoveChild(node, True)
    Next
    Return htmlDoc.DocumentNode.WriteContentTo
End Function

私はほとんどそこにいました...:P

于 2010-01-24T15:30:13.017 に答える