青空文庫からhtmlソースを入手しています。HTMLファイルはShift-JISでエンコードされています。本のタイトルと著者を取得しようとしています。次に、タイトルと著者を SQLite(UTF-8) データベースに記録します。
String[] splittedResult = result.split("\"title\">");
splittedResult = splittedResult[1].split("</h1>");
String title = splittedResult[0];
byte[] b = null;
try {
b = title.getBytes("Shift_JIS");
} catch (UnsupportedEncodingException e1) {
// TODO Auto-generated catch block
e1.printStackTrace();
}
String value=null;
try {
value = new String(b, "UTF-8");
} catch (UnsupportedEncodingException e1) {
// TODO Auto-generated catch block
e1.printStackTrace();
}
...
myDatabase.addBookInformation(value, author);
結果は次のようになります。ラテン文字は正常に表示されています。ただし、日本語の文字はブロック内のクエスチョン マークで示されます (null 値に注意してください)。
この問題を解決するには?