特定の HtmlPage オブジェクトの HTML 全体が必要です。
どのプロパティを使用すればよいですか?
HtmlUnit では、インターフェイスをHtmlPage
実装します。Page
つまり、 を使用Page#getWebResponse()
して、返された Web 応答全体を取得して を生成できます。HtmlPage
そこからは簡単です ( WebResponse#getContentAsString()
)。ここにあなたが望むことをする方法があります...
public String getRawPageText(WebClient client, String url)
throws FailingHttpStatusCodeException, MalformedURLException, IOException {
HtmlPage page = client.getPage(url);
return page.getWebResponse().getContentAsString();
}
または、HtmlPage
すでにフェッチしたオブジェクトを使用します。
public String getRawPageText(HtmlPage page) {
return page.getWebResponse().getContentAsString();
}
これを行う最も簡単な方法は次のとおりですHtmlPage.asXml
-通常のブラウザで「ソースを表示」した場合に表示されるものと完全に一致しない場合があるため、完全ではないかもしれませんが、非常に役立つことがわかりましたHtmlUnit コードの開発とデバッグ。