製品価格をスクレイピングするスクレイパーを作成しています。このサイトの div クラスのように無視する必要がありますが、すべての Web サイトで変更可能であるため、これは本当に問題です。あなたはここで私が最初の要素をこするのを見ることができます、そしてそれはこのようになります
1 - <div class="ProductPrice">
<span id="ctl00_ContentPlaceHolder1_Category1_ctrl_0_ctrl_7_mainGrid_ctl00_PUnit_lblPriceWithTax">47,00 TL</span>
</div>
次に、2番目のタグをスクレイプします(タグ名は変更可能であるため、回答の前にこれを検討してください)
2 - <span id="ctl00_ContentPlaceHolder1_Category1_ctrl_0_ctrl_7_mainGrid_ctl00_PUnit_lblPriceWithTax">47,00 TL</span>
私のコードは次のとおりです。
Elements allElements = newDocument.getAllElements();
for (int j = 0; j < allElements.size(); j++) {
Element element = allElements.get(j);
if (element.text().matches(regex){
// Writing to console.
}
}