0

ブラウザーからソース コードを読み取ろうとしているのですが、コードに ã、á、à、õ などの文字が含まれていると、代わりに � が表示されます。

読み取り行に適用しようとしましjava.nio.Charset.encodeたが、結果はありません。同じことが起こります。

私のコードは次のとおりです。

URLConnection connection = ...;
BufferedReader reader = new BufferedReader(connection.getInputStream());
String s = null;

while ((s = reader.readLine()) != null) {
  // got new source line...
}

私が読もうとしているサイトはこれです(PT-BR)。

4

1 に答える 1

2

メタ タグによると、そのページの文字セットは ISO-8859-1 です。使用してみてください:

Scanner scanner = new Scanner(connection.getInputStream(), "ISO-8859-1");
于 2013-03-20T00:44:11.557 に答える