このようなjsoupで作成されたドキュメントがあります
Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
それを文字列に変換するにはどうすればよいですかdoc
。
このようなjsoupで作成されたドキュメントがあります
Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
それを文字列に変換するにはどうすればよいですかdoc
。
やってみました:
Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
String htmlString = doc.toString();
DocumentはElementを拡張するため、 APIに従って「要素の内部 HTML を取得する」メソッドhtml()も取得します。それでうまくいくはずです:
Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
String htmlString = doc.html();
追加情報:
各Documentオブジェクトは、Document のメソッドoutputSettings()を介してアクセスできる内部クラスDocument.OutputSettingsのインスタンスへの参照を取得しています。セッターprettyPrint(true/false)を使用して、プリティプリントを有効/無効にすることができます。詳細については、 DocumentおよびDocument.OutputSettingsのAPI を参照してください。
doc.toString()
works, as does doc.outerHtml()
.
Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
Elements post = doc.select("div.post-content");
String dd = post.toString();
Document ddd = Jsoup.parse(dd);
文字列をドキュメントに解析した後、ドキュメント関数を使用できます
Elements scriptTag = ddd.getElementsByTag("script");
System.out.println(scriptTag);