Web ページの本文にあるすべての html タグを調べて、テキストが含まれているかどうかを確認しようとしています。もしそうなら、私はそのテキストの印刷を希望します:
Document doc = Jsoup.connect(site).get();
Elements e = doc.body().getAllElements();
for (int i=0; i<e.size(); i++){
if(doc.body().child(i).hasText()){
System.out.println(doc.body().child(i).text());
}
}
上記は機能しますが、私が望む方法ではありません。child() メソッドは、複数の 'div クラス' 要素をまとめているため、きめの細かいものではないようです。DOM 本体をよりきめ細かくトラバースして、すべてのタグのテキストが何であるかを確認するにはどうすればよいですか?
前もって感謝します。