27

このようなjsoupで作成されたドキュメントがあります

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();

それを文字列に変換するにはどうすればよいですかdoc

4

3 に答える 3

42

やってみました:

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
String htmlString = doc.toString();

DocumentElementを拡張するため、 APIに従って「要素の内部 HTML を取得する」メソッドhtml()も取得します。それでうまくいくはずです:

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
String htmlString = doc.html();

追加情報:

Documentオブジェクトは、Document のメソッドoutputSettings()を介してアクセスできる内部クラスDocument.OutputSettingsのインスタンスへの参照を取得しています。セッターprettyPrint(true/false)を使用して、プリティプリントを有効/無効にすることができます。詳細については、 DocumentおよびDocument.OutputSettingsのAPI を参照してください。

于 2011-07-28T20:17:59.957 に答える
9

doc.toString() works, as does doc.outerHtml().

于 2011-07-28T20:20:25.893 に答える
0
 Document doc = Jsoup.connect("http://en.wikipedia.org/").get();     
 Elements post = doc.select("div.post-content");
 String dd = post.toString();
 Document ddd = Jsoup.parse(dd);

文字列をドキュメントに解析した後、ドキュメント関数を使用できます

 Elements scriptTag = ddd.getElementsByTag("script");
 System.out.println(scriptTag);
于 2014-09-03T03:10:47.350 に答える