HTMLファイルの一部の要素を置き換えて、他のすべてのコンテンツを変更しないようにします。
Document doc = Jsoup.parse("<div id=title>Old</div >\n" +
"<p>1<p>2\n" +
"<table><tr><td>1</td></tr></table>");
doc.getElementById("title").text("New");
System.out.println(doc.toString());
次の出力が期待されます。
<div id=title>New</span></div >
<p>1<p>2
<table><tr><td>1</td></tr></table>
代わりに、私は持っています:
<html>
<head></head>
<body>
<div id="title">New</div>
<p>1</p>
<p>2 </p>
<table>
<tbody>
<tr>
<td>1</td>
</tr>
</tbody>
</table>
</body>
</html>
Jsoupは追加しました:
- pタグを閉じる
- 属性値への二重引用符
- tbody
- html、頭と体の要素
変更したHTMLをシリアル化して元に戻すことはできますか?Jerichoはそれを行いますが、Jsoupのように洗練されたDOM操作メソッドを提供しません。