MS Wordからいくつかのテキストフィールドが貼り付けられたDBがあり、タグとタグだけを削除するのに問題がありますが、明らかにそれらのinnerTextは保持されています。
HAPを使用してみましたが、正しい方向に進んでいません。
Public Function StripHtml(ByVal html As String, ByVal allowHarmlessTags As Boolean) As String
Dim htmlDoc As New HtmlDocument()
htmlDoc.LoadHtml(html)
Dim invalidNodes As HtmlNodeCollection = htmlDoc.DocumentNode.SelectNodes("//div|//font|//span")
For Each node In invalidNodes
node.ParentNode.RemoveChild(node, False)
Next
Return htmlDoc.DocumentNode.WriteTo()
End Function
このコードは、必要な要素を選択して削除するだけですが、内部テキストは保持しません。
前もって感謝します