要求を実行して動的 Web サイトから応答を取得したいのですが、通常のブラウザー (クロムなど) でこれを実行し、ソース コードを表示すると、すべてのテキストが表示されます (javascript は表示されません) が、wget または HttpClient を実行しようとすると、 javascript を使用し、テキストを使用しない応答。
テキストは動的ですが、最終的なソース コード (テキスト付き) を受け取るにはどうすればよいですか?
明確でない場合は、次の手順に従ってください。
2 - 要素を検査し、detalhe.asp のソース コードを確認する
3 - ターミナルを開き、wget を使用してこのページを取得します
今、あなたは違いを見ることができますか?
----編集----助けがあれば、HttpClientでこれをやろうとしています:
private static InputStream getPageSource(String url) {
InputStream inputStream = null;
try {
HttpClient httpclient = new DefaultHttpClient();
HttpResponse response = httpclient.execute(new HttpGet(url));
StatusLine statusLine = response.getStatusLine();
if(statusLine.getStatusCode() == HttpStatus.SC_OK){
ByteArrayOutputStream out = new ByteArrayOutputStream();
response.getEntity().writeTo(out);
out.close();
String responseString = out.toString();
//..more logic
System.out.println(responseString);
inputStream = response.getEntity().getContent();
} else{
//Closes the connection.
response.getEntity().getContent().close();
throw new IOException(statusLine.getReasonPhrase());
}
} catch (Exception e) {
e.printStackTrace();
}
return inputStream;
}
---- 編集 2 ---- ヘッダーに 1 つのフィールドを入れてこの作業を行うようにしました: Referer
httpclient を実行する前に次の行を追加した場合: get.setHeader("Referer", "http://www.stj.jus.br/webstj/processo/Justica/pagina_lista.asp"); すべてが機能します..だから、今の問題は次のとおりです。
このパラメーター (Referer) を HttpClient から自動的に取得するにはどうすればよいですか?