VB.NET で HTML のタグ間のすべての空白を削除する方法はありますか?
言って、私はこれを持っています:
<tr>
<td>
作成した文字列は HTML ドキュメント全体であり、これらのタグの前にあるすべての文字列が正当なスペースとしてカウントされるため、それを削除する必要があります。これを行うために使用できる正規表現または関数はありますか?
ありがとう
VB.NET で HTML のタグ間のすべての空白を削除する方法はありますか?
言って、私はこれを持っています:
<tr>
<td>
作成した文字列は HTML ドキュメント全体であり、これらのタグの前にあるすべての文字列が正当なスペースとしてカウントされるため、それを削除する必要があります。これを行うために使用できる正規表現または関数はありますか?
ありがとう
ドキュメントの複雑さに応じて、おそらくドキュメント全体で正規表現を置き換えるだけで済みます...次のようなものです:
RegexObj.Replace(">[\s\n]*<","><")
ここで.NETと正規表現について読むことができます
上記の解決策は良いスタートですが、コードが少し間違っており、正規表現が必要以上に多くなっています。この場合に必要な最小限のことは次のとおりです。
Dim RegexObj As New Regex(">[\s]*<")
NewText = RegexObj.Replace(OldText, "><")
\n
.Netでは、空白文字のセットにキャリッジリターン文字とラインフィード文字が含まれているため、これは不要です(\s)
。他の言語についてはよくわかりません。そうでない場合は\r
、Windowsの改行が\r\n
正規表現に含まれているだけでなく、文字も含める必要があります\n
。