Java で JSoup を使用して、条件を満たす特定のタグの後に定義リスト (または任意のタグ) のコンテンツを取得しようとしています。例として、次のような html ドキュメントがあるとします。
<p>PageID: 2816; NS: 0; Title: some text;
Image url:
Content:
{{Wort der Woche}}
{{Siehe auch}}
</p>
<h2><span class="1" id="e1">some text</span></h2>
<h3><span class="1" id="e2">some text</span></h3>
<p>{{Transportation}}
</p>
<dl>
<dd>Flying</dd>
<dd>Driving</dd>
<dd>Sailing
<dl>
<dd>Boat</dd>
<dd>Ship</dd>
</dl>
</dd>
</dl>
<p>{{Activities}}
</p>
<dl>
<dd>Shopping</dd>
<dd>Painting</dd>
</dl>
"Transportation" の後に出現する "dl" タグの内容を取得したいとします。つまり、次のコンテンツ:
<dl>
<dd>Flying</dd>
<dd>Driving</dd>
<dd>Sailing
<dl>
<dd>Boat</dd>
<dd>Ship</dd>
</dl>
</dd>
</dl>
私の最初の試みは、段落のインデックス(1st、2ndなど)を取得してから、対応するdlを取得することでしたが、dlをネストできるため、これは機能していないようです。
そのようなコンテンツを入手する方法について誰か提案がありますか?