いくつかの要素も含む JSOUP を使用して HTML を解析しています。ただし、結果の doc.html() を印刷すると、代わりに:
<script language="JavaScript"> <a href="http://www.company.com/index.htm" </a> </script>
私は得ています:
<script language="JavaScript"> <a href="http://www.company.com/index.htm" </a> </script>
コードでは、次のような操作を行います。
for (final Element src : doc.select("script")) {
data = data.replace(someText,newText);
src.text(data); <==== I could find this method escapes the text }
UTF-8 文字セットを使用しています。
エスケープされていないテキストを直接取得するにはどうすればよいですか? 前もって感謝します !