1

青空文庫からhtmlソースを入手しています。HTMLファイルはShift-JISでエンコードされています。本のタイトルと著者を取得しようとしています。次に、タイトルと著者を SQLite(UTF-8) データベースに記録します。

    String[] splittedResult = result.split("\"title\">");
            splittedResult = splittedResult[1].split("</h1>");
            String title = splittedResult[0];
            byte[] b = null;
            try {
                b = title.getBytes("Shift_JIS");
            } catch (UnsupportedEncodingException e1) {
                // TODO Auto-generated catch block
                e1.printStackTrace();
            }
            String value=null;
            try {
                value = new String(b, "UTF-8");
            } catch (UnsupportedEncodingException e1) {
                // TODO Auto-generated catch block
                e1.printStackTrace();
            }

...
myDatabase.addBookInformation(value, author);

結果は次のようになります。ラテン文字は正常に表示されています。ただし、日本語の文字はブロック内のクエスチョン マークで示されます (null 値に注意してください)。

ここに画像の説明を入力

この問題を解決するには?

4

1 に答える 1

1

@Codo が指摘したように、この問題の解決策は以前のものでした。これを変更しました

s = EntityUtils.toString(response.getEntity(), "UTF-8");

これに

s = EntityUtils.toString(response.getEntity(), "Shift_JIS");

そして今、エンコードの必要はありません。

String[] splittedResult = result.split("\"title\">");
        splittedResult = splittedResult[1].split("</h1>");
        String title = splittedResult[0];
        /** I HAVE TAKEN THIS PART OF MY CODE
        byte[] b = null;
        try {
            b = title.getBytes("Shift_JIS");
        } catch (UnsupportedEncodingException e1) {
            // TODO Auto-generated catch block
            e1.printStackTrace();
        }
        String value=null;
        try {
            value = new String(b, "UTF-8");
        } catch (UnsupportedEncodingException e1) {
            // TODO Auto-generated catch block
            e1.printStackTrace();
        }
        **/
于 2014-03-24T20:31:55.657 に答える