Document doc = Jsoup.connect("http://www.utah.edu/").get();
Elements lists = doc.select("ul");
for (Element list: lists) {
Elements li = list.select("li a");
if (li.size() > 0) {
ArrayList<String> anchors = new ArrayList<String>();
for (Element e : li) {
anchors.add(e.text());
}
System.out.println(anchors);
}
}
このページul
のタグによってレンダリングされたすべての html リストを取得しようとしています。しかし、それは失敗しました。私のプログラムがそうするのを妨げているスクリプトがページにあると思われます。
編集:私の質問をさらに簡単にするために、次のコードを検討してください:
Document doc = Jsoup.connect("http://www.utah.edu/").get();
Elements lists = doc.select("ul");
System.out.println(lists.size());
出力:
0