0

私はこのようなノードを持っています

<div>&gt; something &lt;</div>

このような div 要素のテキストを取得する必要があります

&gt; something &lt;

.text() メソッドから得られるもの、出力は

> something <

BeautifulSoup では、&gt; something &lt;エンコードされていない出力が返されます。

JSoup から未変換のテキストを取得するにはどうすればよいですか?

4

1 に答える 1

0
doc = Jsoup.connect(url).get();
doc.outputSettings().escapeMode(Entities.EscapeMode.extended);

また

これには Apache Commons StringEscapeUtils.unescapeHtml4()を使用します。

Unescapes a string containing entity escapes to a string containing the actual Unicode characters corresponding to the escapes. Supports HTML 4.0 entities.
于 2013-07-03T12:20:25.757 に答える