HTML ファイルを読み込んで解析するために、Jsoup という HTML パーサーを使用しています。ISO-8859-1
問題は、 Android がUTF-8
エンコーディング (?)を使用しているときに、スクレイピングしている Web ページが文字セットでエンコードされていることです。これにより、一部の文字が疑問符として表示されます。
したがって、文字列を UTF-8 形式に変換する必要があると思います。
これで、Android SDK にCharsetEncoderという名前のこのクラスが見つかりました。これが役立つと思います。しかし、実際に実装する方法がわからないので、実際の例で助けてもらえないでしょうか。
更新: データを読み取るコード ( Jsoup )
url = new URL("http://www.example.com");
Document doc = Jsoup.parse(url, 4000);