あるデータベースから別のデータベースにデータをインポートしています。乱雑で有効でないため、すべての HTML コンテンツを取り除き、リンクだけを残すように依頼されました。
現在、次の VB.NET 関数を使用して、コンテンツの文字列からすべての HTML タグを削除しています。
Public Shared Function StripHTML(ByVal htmlString As String) As String
Dim pattern As String = "<(.|\n)*?>"
Return Regex.Replace(htmlString, pattern, String.Empty)
End Function
すべてを削除する方法を探していますが、a
(アンカー) タグをコンテンツから削除します。
たとえば、次の HTML コンテンツがあるとします。
<table>
<tr>
<td>
Lorem <a href="http://google.com">Ipsum</a>
</td>
</tr>
</table>
これは単純に次のようになります。
Lorem <a href="http://google.com">Ipsum</a>
これどうやってするの?