私はJavaを使用してWebページからHTMLのチャンクを取得しています。現在、getInputStream()でURLConnectionを使用しています。これは、ページ全体をロードしていて、必要以上に時間がかかります。とにかく、必要なチャンクだけをロードしたり、画像やそれを高速化できるその他のものを除外したりすることはできますか?どんな助けでも大歓迎です。ありがとうございました。
ここにいくつかのコードがあります:
URL page = new URL("http://www.stackoverflow.com");
URLConnection connection = page.openConnection();
String html = getResponseData(connection);
public static String getResponseData(URLConncetion connection) {
StringBuffer sb = new StringBuffer();
InputStream is = connection.getInputStream();
int count;
while((count=is.read()) != -1){
sb.append((char)count);
}