2

HTMLページに以下のようなjavascriptがあり、var番号の値を抽出したい。

<script type="text/javascript">
 var number= 4443;
</script>

このコマンドを使用してhtmlページを解析するためにjsoupを使用しています。

org.jsoup.nodes.Document doc3 = Jsoup.connect("http://htmlpage.com").get();

どうすればできますか?よろしくお願いします。

4

1 に答える 1

1

Jsoup は HTML パーサーであり、JS パーサーではありません。Jsoup で得られる最善の方法は、HTML<script>要素を取得することです。

Elements scripts = doc3.select("script");

そのコンテンツは、Element#text()Mozilla Rhino などの JS コードを解析できる別のライブラリによってテキストとして抽出され、さらに解析される必要があります。もちろん、、 などのメソッドを使用して簡単なString解析を実行することもできます。また、適切な正規表現を使用することもできます。indexOf()substring()

于 2012-11-27T17:36:01.970 に答える