java - Jsoup (Java html パーサー) で作成されたドキュメントを文字列に変換するにはどうすればよいですか?

Question

このようなjsoupで作成されたドキュメントがあります

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();

それを文字列に変換するにはどうすればよいですかdoc。

score 42 · Accepted Answer

やってみました：

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
String htmlString = doc.toString();

DocumentはElementを拡張するため、 APIに従って「要素の内部 HTML を取得する」メソッドhtml()も取得します。それでうまくいくはずです：

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
String htmlString = doc.html();

追加情報：

各Documentオブジェクトは、Document のメソッドoutputSettings()を介してアクセスできる内部クラスDocument.OutputSettingsのインスタンスへの参照を取得しています。セッターprettyPrint(true/false)を使用して、プリティプリントを有効/無効にすることができます。詳細については、 DocumentおよびDocument.OutputSettingsのAPI を参照してください。

score 9 · Accepted Answer

9

doc.toString() works, as does doc.outerHtml().

于 2011-07-28T20:20:25.893 に答える

score 0 · Accepted Answer

 Document doc = Jsoup.connect("http://en.wikipedia.org/").get();     
 Elements post = doc.select("div.post-content");
 String dd = post.toString();
 Document ddd = Jsoup.parse(dd);

文字列をドキュメントに解析した後、ドキュメント関数を使用できます

 Elements scriptTag = ddd.getElementsByTag("script");
 System.out.println(scriptTag);

java - Jsoup (Java html パーサー) で作成されたドキュメントを文字列に変換するにはどうすればよいですか?

3 に答える 3

Related

Reference