Jsoupを使用してWebサイトを取得します。Webサイトには、次のような複数のdivクラスがあります。
<div class="itemcategories">
Category: <a id="cat_result_7_newamerican" class="category" rel="newamerican" href="/search?cflt=newamerican&find_loc=willowbrook%2C+IL">American (New)</a>
</div>
<div class="itemcategories">
Categories:
<a id="cat_result_6_breakfast_brunch" class="category" rel="breakfast_brunch" href="/search?cflt=breakfast_brunch&find_loc=willowbrook%2C+IL">Breakfast & Brunch</a>,
<a id="cat_result_6_tradamerican" class="category" rel="tradamerican" href="/search?cflt=tradamerican&find_loc=willowbrook%2C+IL">American (Traditional)</a>
</div>
等々。
次のクエリセレクターを使用する場合:
categories = doc.select("div[class=itemcategories] > a[class=category]");
div class = "itemcategories"親から直接派生する各子要素は、categoriesElementsオブジェクトの次のインデックスに格納されます。そのため、どの子がどの親に属しているかを判断する方法がありません。各divクラスのすべての子を「連結」して、Elementsオブジェクトの個別のインデックスに保存する方法はありますか?