BufferedReader を含み、Web サイトから HTML データを読み取るこのコードがあります。ただし、読み込んでいるサイトの各ページには 600 行ほどの HTML が含まれているため、毎回データを読み取るのに時間がかかります。(たとえば)文字/単語「on」で始まる行を読み取らないことで、コードをより効率的にしたいと考えています。これはできますか?これは私のコードです:
public String getInternetData(String s) throws Exception {
BufferedReader in = null;
try{
HttpClient client = new DefaultHttpClient();
URI website = new URI(s);
HttpGet request = new HttpGet();
request.setURI(website);
HttpResponse response = client.execute(request);
in = new BufferedReader(new InputStreamReader(response.getEntity().getContent()));
StringBuffer sb = new StringBuffer("");
String l = "";
String nl = System.getProperty("line.seperator");
while(((l = in.readLine()) != null)){
sb.append(l+nl);
}
in.close();
return sb.toString();
}finally{
try {
if(in != null) {
in.close();
}
}catch(Exception e){
e.printStackTrace();
}
}
}
このコードは完全に機能しており、Web ページ全体の HTML を含む文字列を返します。最初に行全体を読み取らずに、「on」で始まる行を除外する方法はありますか?