私はjsoupを使用してxml処理を行っています。問題は、xml エンティティを置き換えることです。つまり»
、html エンティティを使用します。»
元の (xml) エンティティを保持するにはどうすればよいですか?
グルーヴィーなスクリプト:
import org.jsoup.Jsoup
import org.jsoup.nodes.Document
import org.jsoup.nodes.Entities
import org.jsoup.parser.Parser
String HTML_STRING = '''
<html>
<div></div>
<div>Some text »</div>
</html>
'''
Document doc = Jsoup.parse(new ByteArrayInputStream(HTML_STRING.getBytes("UTF-8")), "UTF-8", "", Parser.xmlParser())
doc.outputSettings().charset("UTF-8")
doc.outputSettings().escapeMode(Entities.EscapeMode.base)
println doc.toString()
結果:
<html>
<div></div>
<div>
Some text »
</div>
</html>
Entities.EscapeMode.xhtml
結果を使用すると、次のようになります。
<html>
<div></div>
<div>
Some text »
</div>
</html>
ありがとう。