HTML ページからテキストを取得しようとしています。正しくダウンロードできますが、スペイン語のアクセント (á、é、í、ó、ú) とおそらく他の特殊文字 (ü) が ? の付いた四角形のように表示されます。中に印をつけます。
私が使用する InputStreamReader が読み取り関数を呼び出すと、テキストは既にこのように表示されますが、コンテンツを格納する HTML ページとデータベースは問題ありません。
InputStreamReader に期待する文字エンコーディングを指定する方法はありますか? 私は元々データベースで utf8_general_ci を使用しており、それをテキストを取得する php ページに表示しています。
ありがとう。
private String DownloadText (String URL)
{
int BUFFER_SIZE = 2000;
InputStream in = null;
try
{
in = OpenHttpConnection(URL);
}
catch (IOException e)
{
return "";
}
InputStreamReader isr = new InputStreamReader(in);
int charRead;
String str = "";
char[] inputBuffer = new char[BUFFER_SIZE];
try
{
charRead = isr.read(inputBuffer);
str = String.copyValueOf(inputBuffer,0,charRead);
inputBuffer = null;
in.close();
}
catch(IOException e)
{
return "";
}
return str;
}