現在、HttpComponents に HttpRequests を送信して Response を取得させようとしています。ほとんどの URL ではこれは問題なく動作しますが、phpBB フォーラムの URL、つまりhttp://www.forum.animenokami.comを取得しようとすると、クライアントの処理に時間がかかり、responseEntity に複数のパッセージが含まれているため、エラーが発生します。 html ファイル。
たとえば、メタ タグは 6 回含まれています。他の多くの URL が機能するため、何が間違っているのかわかりません。ページは既知のブラウザで正しく機能しているため、ブラウザ側の問題ではありません。
これが私が送受信に使用するコードです。
URI uri1 = new URI("http://www.forum.animenokami.com");
HttpGet get = new HttpGet(uri1);
get.setHeader(new BasicHeader("User-Agent", "Mozilla/5.0 (Windows NT 5.1; rv:6.0) Gecko/20100101 Firefox/6.0"));
HttpClient httpClient = new DefaultHttpClient();
HttpResponse response = httpClient.execute(get);
HttpEntity ent = response.getEntity();
InputStream is = ent.getContent();
BufferedInputStream bis = new BufferedInputStream(is);
byte[] tmp = new byte[2048];
int l;
String ret = "";
while ((l = bis.read(tmp)) != -1){
ret += new String(tmp);
}
あなたが私を助けてくれることを願っています。さらに情報が必要な場合は、できるだけ早く提供できるように努めます。