Twitter のプロフィール ページから html を取得しようとしていますが、httpurlconnection は html の小さなスニペットしか返しません。私のコード
for(int i = 0; i < urls.size(); i++)
{
URL url = new URL(urls.get(i));
HttpURLConnection connection = (HttpURLConnection) url.openConnection();
connection.setRequestProperty("User-Agent","Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.2.6) Gecko/20100625 Firefox/3.6.6");
System.out.println(connection.getResponseCode());
String line;
StringBuilder builder = new StringBuilder();
BufferedReader reader = new BufferedReader(new InputStreamReader(connection.getInputStream()));
while((line = reader.readLine()) != null)
{
builder.append(line);
}
String html = builder.toString();
}
各呼び出しの応答コードとして常に 200 を取得します。ただし、約 1/3 の時間で HTML ドキュメント全体が返され、残りの半分は最初の数百行のみが返されます。html が切り捨てられたときに返される金額は常に同じではありません。
何か案は?助けてくれてありがとう!
追加情報: ヘッダーを表示した後、コンテンツの長さのヘッダーが重複しているようです。1 つは完全な長さで、もう 1 つははるかに短いです (おそらく、私が時々得ている長さを表しています)。重複したヘッダーを処理するにはどうすればよいですか?