1

指定されたコードから a href 値を抽出する必要があります

<table>
<tr>
<td class="left ">
<a href="reference" >Refer</a>see this
<sup class="super"><a href=​"#src1" onclick=​"dosomething;​" title=​"1" >​1​&lt;/a>​&lt;/sup>
</td>
<td class="td_right2" style="padding-top: .25em"></td>
</tr>
..

</table>

私のコードは

 for(Element info: div3.select("tr")){
 Elements aqInfo= companyB.select("td") 
 String href=aqInfo.text(); 
 }

href は、タグ内のテキスト以外のテキストのみを提供します

sup タグ内の text タグと href タグを取得するにはどうすればよいですか?

編集:ページのソースが次のようになっていることに気付きました

<tr><td class="left "><a href="reference" ">Reference</a>see this <sup class="super_src"></sup></td><td class="right" style="padding-top: .25em"></td></tr>

firefox の「inspect 要素」は<a>内部<sup>を示しており、この の内容が必要<a>です。間違っている場合は訂正してJsoup.connect(url).get();ください。ただし、ソース ドキュメントが表示され、Inspect 要素が現在読み込まれているページが表示されると思います。ページが完全に読み込まれた後にページを取得する方法はありますか?

4

1 に答える 1

0

これを試してください:

Element mySup= doc.select("sup.super").first();
String linkHref = mySup.child(0).attr("href");
String linkVal = mySup.child(0).text();

説明:

suptag を持つ要素を選択し、superクラスがその最初の子であるatag にアクセスしてから、そのhref属性にアクセスします

hrefすべてを取得し、すべてから取得text inside the aするa必要があります。

Elements links = doc.select("a[href]");
for (Element link : links) {
  String linkHref = link.attr("href");
  String linkText = link.text();
}
于 2012-06-20T09:05:45.463 に答える