テキスト ファイルや Web ページの文字エンコーディングの決定については、これまで多くの議論が行われてきました。
Web ページの場合、Url を入力として受け取り、適切にエンコードされた文字列を返すライブラリを使用するのが最善/簡単な方法のようです。ライブラリはドキュメントを取得しているため、HTTP ヘッダーを使用してエンコーディングを決定できます。
- http://htmlcleaner.sourceforge.net/download .
- JavaでWebページをプログラムでダウンロードする方法
- Java を使用した Web ページの文字エンコーディング
- http://docs.oracle.com/javase/6/docs/technotes/guides/intl/encoding.doc.html
UrlFetch、具体的には非同期 API を使用してドキュメントをフェッチする場合、最善の方法、ライブラリは何ですか? エンコーディングを決定するため。
async urlfetch と統合する (または統合するために簡単に変更できる) ライブラリはありますか?