Jsoup ライブラリを使用して URL を読み取ります。この URL には、いくつかの<script>
タグ内にテキストがあります。<script>
各タグ内のテキストを取得することはできますか? JSoup では許可されていないことを既に認識しているため、Javascript ファイルの解析を求めているわけではないことに注意してください。URL の実際のソース コードには、script タグ内にテキストが含まれています。それが必要です。
doc = Jsoup.connect("http://www.example.com").timeout(10000).get();
Element div = doc.select("script").first();
for (Element element : div.children()) {
System.out.println(element.toString());
}
これは、ソース コードからスクリプト タグの 1 つがどのように見えるかです。
<script type="text/javascript">
(function() {
...
})();
</script>