1

必要なコンテンツを取得するために、html 文字列をソートする必要があります。ここで、ID を持つテーブル内のテーブル行をループする必要があります。正規表現でこれを行うにはどうすればよいですか?

4

4 に答える 4

1

HTML の解析に正規表現を使用することはできません。HTML は規則的ではありません。適切な HTML パーサー ライブラリを使用します。

于 2010-01-18T09:55:33.000 に答える
1

HTML テキストの規則性に依存します。たとえば、次の表があるとします。

<table>
  <tr><td>1</td><td>Apple</td></tr>
  <tr><td>2</td><td>Ball</td></tr>
  <tr><td>3</td><td>Cookie</td></tr>
<table>

次の正規表現は、最初の列で ID を検索します。

(?<=<tr><td>).*?(?=</td>)
于 2010-01-18T10:06:42.773 に答える
0

これを試して

Dim HTML As String = contentText
Dim options As RegexOptions = RegexOptions.IgnoreCase Or RegexOptions.Singleline
Dim regex As Regex = New Regex("<table[^>]*>(.*)</table>", options)
Dim match As MatchCollection = regex.Matches(HTML)
Dim sb As StringBuilder = New StringBuilder
For Each items As Match In match
    sb.Append(items.ToString & vbLf)
Next
TextBox.Text = sb.ToString
于 2012-05-24T11:11:28.093 に答える
0

BeautifulSoup のような html パーサーを使用してページを実行すると、この種の正規表現が可能になるようにページを整形することができます。しかし、とにかくhtmlを解析している場合...

于 2010-01-18T13:19:35.760 に答える