Web サイトをクロールする場合はHttpClient
、ほぼすべての HTTP プロトコル操作を提供できる を使用できます。これは、あなたが望むものに合うかもしれないコードスニペットです:
HttpClient httpclient = new DefaultHttpClient();
HttpGet httpget = new HttpGet("http://globoesporte.globo.com/temporeal/futebol/20-10-2013/botafogo-vasco/");
HttpResponse response = httpclient.execute(httpget);
HttpEntity entity = response.getEntity();
if (entity != null) {
InputStream instream = entity.getContent();
try {
// do something useful
} finally {
instream.close();
}
}
PS
Maven for HttpClient
:
<dependency>
<groupId>commons-httpclient</groupId>
<artifactId>commons-httpclient</artifactId>
<version>3.1</version>
</dependency>
それが役に立てば幸い:)