1

Java で Web ページからデータを取得すると、html エンティティが正しく表示されない理由:

    URL url = new URL("http://www.eslcafe.com/joblist/index.cgi?read=27334");
    URLConnection connection = url.openConnection();

    BufferedReader reader = new BufferedReader(new InputStreamReader(connection.getInputStream(), Charset.forName("ISO-8859-1")));

    String line = null;

    while ((line = reader.readLine()) != null) {

        System.out.println(line);
    }

このページのタイトルは「台湾の新竹では少し違う!」と表示されるはずですが、「 」が正しく表示されませんでした。デフォルトの文字セットも「ISO-8859-1」です。

4

1 に答える 1

0

あなたの Web ページを curl でダウンロードし、16 進エディタで開きました。「A LITTLE Different in Hsin-Chu」の前の「 」は、実際には 0x20 ではなく 0xA0 であることを示しています。つまり、これは人々が一般的に使用する空白文字ではないため、正しく表示されない可能性があります。それが役に立てば幸い。

于 2012-12-30T08:41:58.003 に答える