現在、WebページからHTMLコードの次のセクションがあります。
<td class="movieclass">
<b>Cinema 1</b>
10.30 AM. + 12.45 + 3.00 + 5.15 + 7.30 + 9.45 + 12.00 MN.
<br />
<b>Cinema 2</b>
3.00 + 5.15 + 7.30 + 9.45 + (12.00 MN. THRS./FRI.)
<br />
<b>Cinema 3</b>
2.30 + 4.45 + 7.00 + 9.15 + (12.15 PM. + 11.30 PM. THRS./FRI.)
<br />
<b>Cinema 4</b>
11.30 AM. + 2.00 + 4.30 + 7.00 + 9.30 + 12.00 MN.
<br />
<b>Cinema 5</b>
10.30 AM. + 1.00 + 3.30 + 6.00 + 8.30 + 11.00 PM.
<br />
</td>
私はjsoupを使用して時間を抽出しようとしていますが、特定の映画館用です。タイムラインが段落(pタグ)内にある場合は、以下を使用して抽出できると思います。
Elements movieTime = doc.select("a:contains(Cinema 3) + p");
ただし、上記のコードでは、時間のある行の前後にタグがありません。特定の映画のタイムラインを抽出する方法はありますか?