300,000のURLをクロールしようとしています。ただし、途中で、URLから応答コードを取得しようとするとコードがハングします。接続が確立されているため、何が問題になっているのかわかりませんが、その後問題が発生しています。提案されているように、読み取りタイムアウトとリクエストプロパティを設定するコードを変更しましたが、今でもコードはレスポンスコードを取得できません!任意の提案/ポインタは大歓迎です。また、特定の期間Webサイトにpingを実行し、応答しない場合は次のWebサイトに進む方法はありますか?
これが私の変更されたコードスニペットです:
URL url=null;
try
{
   Thread.sleep(8000);
}
catch (InterruptedException e1)
{
   e1.printStackTrace();
}
 try
{
   //urlToBeCrawled comes from the database
   url=new URL(urlToBeCrawled);
}
catch (MalformedURLException e)
{
   e.printStackTrace();
 //The code is in a loop,so the use of continue.I apologize for putting code in the catch block.
  continue;
}
 HttpURLConnection huc=null;
 try
{
   huc = (HttpURLConnection)url.openConnection();
}
catch (IOException e)
{
   e.printStackTrace();
}
 try
 {
    //Added the request property
   huc.addRequestProperty("User-Agent", "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)");
  huc.setRequestMethod("HEAD");
 }
 catch (ProtocolException e)
 {
    e.printStackTrace();
 }
 huc.setConnectTimeout(1000);
 try
 {
    huc.connect();
  }
 catch (IOException e)
 {
    e.printStackTrace();
    continue;
  }
 int responseCode=0;
 try
 {
   //Sets the read timeout
   huc.setReadTimeout(15000);
   //Code hangs here for some URL which is random in each run
   responseCode = huc.getResponseCode();
  }
 catch (IOException e)  
{
   huc.disconnect();
   e.printStackTrace();
   continue;
}
if (responseCode!=200)
{
   huc.disconnect();
   continue;
 }