特定の HtmlPage オブジェクトの HTML 全体が必要です。
どのプロパティを使用すればよいですか?
HtmlUnit では、インターフェイスをHtmlPage実装します。Pageつまり、 を使用Page#getWebResponse()して、返された Web 応答全体を取得して を生成できます。HtmlPageそこからは簡単です ( WebResponse#getContentAsString())。ここにあなたが望むことをする方法があります...
public String getRawPageText(WebClient client, String url)
throws FailingHttpStatusCodeException, MalformedURLException, IOException {
HtmlPage page = client.getPage(url);
return page.getWebResponse().getContentAsString();
}
または、HtmlPageすでにフェッチしたオブジェクトを使用します。
public String getRawPageText(HtmlPage page) {
return page.getWebResponse().getContentAsString();
}
これを行う最も簡単な方法は次のとおりですHtmlPage.asXml-通常のブラウザで「ソースを表示」した場合に表示されるものと完全に一致しない場合があるため、完全ではないかもしれませんが、非常に役立つことがわかりましたHtmlUnit コードの開発とデバッグ。