タグ内にあるページソースを読むのを手伝ってくれる人はいますか?
htmlUnit と jsoup を試してみましたが、内部のコンテンツとタグのみが返されます。どんな反応でも大歓迎です。
タグ内にあるページソースを読むのを手伝ってくれる人はいますか?
htmlUnit と jsoup を試してみましたが、内部のコンテンツとタグのみが返されます。どんな反応でも大歓迎です。
JSoupelement.html()
のタグ自体の包含ではなくHTMLを読み取るために使用します
例えば:
String html = "<p>An </p><form action="SOMESERVLET"><b>example</b></form> ";
Document doc = Jsoup.parse(html);
String htmlContent = doc.select("form").first().html();
あなたの場合
Document doc = Jsoup.connect("example.com").get();
Iterator<Element> itr = doc.select("form").iterator()
while(itr.hasNext()){
Element element = itr.next();
System.out.println(element.html());
}
一歩一歩
<form>
タグを見つけるstart index
</form>
ですlast index
* substring
からstart
_end
単純なアルゴリズムですが、役立つツールがたくさんあると思います!!!