0

次のような文字列があります (HTML ソース コードから作成):

<tr>
  <td>
    <tr>First</tr>
  </td>
</tr>
<tr>
  <td>Second</td>
</tr>
<tr>
  <td>
    <tr>
      <td>Upper</td>
    </tr>
    <tr>
      <td>Lower</td>
    </tr>
  </td>
</tr>

しかし、1行で-見栄えを良くするために分割しました。私が達成したいのは、このテーブルの行全体をキャプチャする正規表現であるため、一致は次のとおりです。

<td>
  <tr>First</tr>
</td>

<td>Second</td>

<td>
  <tr>
    <td>Upper</td>
  </tr>
  <tr>
    <td>Lower</td>
  </tr>
</td>

最も単純なオプション:

  • <tr>.*</tr>- すべてをキャッチ
  • <tr>.*?</tr><tr>- 最初から最初にキャッチし</tr>ます。

対応するタグをキャッチしたい。誰でも助けることができますか?

4

1 に答える 1

1

HTML解析エンジンjsoupを使用して、このようなものを実行して、テーブルから行を引き出すことができます

String url = "a.html";
Document doc = Jsoup.connect(url).get();

Elements rows = doc.select("table tr");
于 2013-06-13T13:07:33.253 に答える