0

これは私がやっていることです:

public static String htmlToText(String inString)
{
String noentity=StringEscapeUtils.unescapeHtml(inString);
return noentity;
}

これは私がそれを呼び出している場所です:

String html = "<html><body>string 1<br />&#8212;<p>string 2</p></body></html>";
    String nohtml = Utility.htmlToText(html);
    Log.i("NON HTML STRING:",nohtml);

そして、これはログの出力です:

10-13 12:38:12.121: INFO/NON HTML STRING:(300): <html><body>string 1<br />â<p>string 2</p></body></html>

http://www.w3.org/TR/html4/sgml/entities.html のリファレンスによると&#8212;、"â" (出力ではない) ではなく "—" (これは私が期待する出力です) に置き換える必要があります。私が欲しいもの)。

最初は JSoup を使用していましたが、同じことが起こっていました。バグだと思って org.apache.commons.lang に切り替えたところ、同じことが起こっています。

ここで何が起こっているか知っている人はいますか?明らかな何かが欠けていますか?

4

1 に答える 1

0

解決済み.....

Logcat の出力に問題がありました。

ブレークポイントを置くと、正しい実際の出力が表示されました。

Logcat ツールによってコースから外れてしまったのはこれで 2 回目です....

于 2010-10-13T20:21:30.180 に答える