私がこのhtmlを持っているとしましょう:
<!-- some comment -->
<div class="someDiv">
... other html
</div>
<!-- some comment 2 -->
<div class="someDiv">
... other html
</div>
私は現在、class == someDivであるすべてのdivを取得しており、情報を得るためにそれらをスクレイピングしています。それを行うために、私は単にこれを行っています:
Document doc = Jsoup.connect(url).get();
Elements elements = doc.select(".someDiv");
for (Element element : elements) {
//scrape stuff
}
forループ内で、私が使用している特定のdiv.someDiv要素の前にあるコメントタグを取得する方法はありますか?
これが不可能な場合は、この要件とは異なる方法でこのhtml構造を解析する必要がありますか?
アドバイスありがとうございます。