Java を使用して Web ページの HTML を取得しようとしています。私はそれを行うためのコードを持っており、それは機能していますが、一部のクライアントに問題があり、Linux サーバーでのみ発生しているようです。Java for Linux またはこれに関連する問題で HTML を取得する別の方法はありますか?
protected static String getWebpageValue(String url, String contains, String endSplit) {
try {
URLConnection cnx = new URL(url).openConnection();
cnx.setRequestProperty("user-agent", "Opera/9.0");
BufferedReader reader = new BufferedReader(new InputStreamReader(cnx.getInputStream()));
String line;
while ((line = reader.readLine()) != null) {
if (line.contains(contains)) {
String[] couple = line.split(contains);
for (int i =0; i < couple.length ; i++) {
String[] items = couple[i].split(endSplit);
line = items[0];
}
return line;
}
}
reader.close();
} catch (ConnectException e){
e.printStackTrace();
return "URL is down";
} catch (MalformedURLException e) {
e.printStackTrace();
return "invalid URL";
} catch (IOException e) {
e.printStackTrace();
return "IOException";
}
return "Encoded String doesn't contain this";
}