私はこのようなノードを持っています
<div>> something <</div>
このような div 要素のテキストを取得する必要があります
> something <
.text() メソッドから得られるもの、出力は
> something <
BeautifulSoup では、> something <
エンコードされていない出力が返されます。
JSoup から未変換のテキストを取得するにはどうすればよいですか?
私はこのようなノードを持っています
<div>> something <</div>
このような div 要素のテキストを取得する必要があります
> something <
.text() メソッドから得られるもの、出力は
> something <
BeautifulSoup では、> something <
エンコードされていない出力が返されます。
JSoup から未変換のテキストを取得するにはどうすればよいですか?
doc = Jsoup.connect(url).get();
doc.outputSettings().escapeMode(Entities.EscapeMode.extended);
また
これには Apache Commons StringEscapeUtils.unescapeHtml4()を使用します。
Unescapes a string containing entity escapes to a string containing the actual Unicode characters corresponding to the escapes. Supports HTML 4.0 entities.