指定されたコードから a href 値を抽出する必要があります
<table>
<tr>
<td class="left ">
<a href="reference" >Refer</a>see this
<sup class="super"><a href="#src1" onclick="dosomething;" title="1" >1</a></sup>
</td>
<td class="td_right2" style="padding-top: .25em"></td>
</tr>
..
</table>
私のコードは
for(Element info: div3.select("tr")){
Elements aqInfo= companyB.select("td")
String href=aqInfo.text();
}
href は、タグ内のテキスト以外のテキストのみを提供します
sup タグ内の text タグと href タグを取得するにはどうすればよいですか?
編集:ページのソースが次のようになっていることに気付きました
<tr><td class="left "><a href="reference" ">Reference</a>see this <sup class="super_src"></sup></td><td class="right" style="padding-top: .25em"></td></tr>
firefox の「inspect 要素」は<a>
内部<sup>
を示しており、この の内容が必要<a>
です。間違っている場合は訂正してJsoup.connect(url).get();
ください。ただし、ソース ドキュメントが表示され、Inspect 要素が現在読み込まれているページが表示されると思います。ページが完全に読み込まれた後にページを取得する方法はありますか?