完全な HTML テーブル (それぞれのすべての属性tr
とtd
追加の属性がある場合) を文字列にコピーするとします。すべてのコンテンツ (タグの間にあるもの) を取得して、元のテーブルのように編成された 2D 配列を作成するにはどうすればよいですか?
たとえば、このテーブルの場合:
<table border="1">
<tr align= "center">
<td align="char">TD1</td>
<td>td1</td>
<td align="char">TD1</td>
<td>td1</td>
</tr>
<tr>
<td>TD2</td>
<td>tD2</td>
<td class="bold>Td2</td>
<td>td2</td>
</tr>
</table>
この配列が欲しい:
PS: 正規表現を使用できることはわかっていますが、非常に複雑です。多くのコードを書かなくても自動的にすべての作業を実行できる JSoup のようなツールが欲しい