Java で Web ページからデータを取得すると、html エンティティが正しく表示されない理由:
URL url = new URL("http://www.eslcafe.com/joblist/index.cgi?read=27334");
URLConnection connection = url.openConnection();
BufferedReader reader = new BufferedReader(new InputStreamReader(connection.getInputStream(), Charset.forName("ISO-8859-1")));
String line = null;
while ((line = reader.readLine()) != null) {
System.out.println(line);
}
このページのタイトルは「台湾の新竹では少し違う!」と表示されるはずですが、「 」が正しく表示されませんでした。デフォルトの文字セットも「ISO-8859-1」です。