2

Jsoup を使用して、次のような間違った html 構造を見つけようとしています。

<body><p><h1>some text</h1></p></body>

最初に見出しタグを選択してから、このタグheadingElement.parent()の親を取得するために使用します。しかし、その親としてh1ではなく、. 誰かが理由を知っていますか?pbody

4

1 に答える 1

0

JSoup は、HTML を解析するときに、優れた HTML パーサーと同様に、タグが開いている要素を<h1>自動的に閉じるという規則を既に適用しているため、とは既にDOM 内の要素の兄弟の子になっています。<p><p><h1><body>

于 2012-05-24T07:42:28.827 に答える