次の URL の html を解析しようとしています。
http://ocw.mit.edu/courses/aeronautics-and-astronautics/16-050-thermal-energy-fall-2002/
インストラクターの名前を含む「< p >」タグのテキストを取得します。必要な情報は「< p >」タグ内にありますが、JSoup を使用してタグを取得できません。Elementオブジェクトにタグを保存すると、それを「b」と呼び、b.getAllElements()を呼び出しても表示されないため、何が間違っているのかわかりません
要素の一つとして。それは Jsoup の getAllElements() メソッドが行うことではないでしょうか。そうでない場合は、パーサーが場所を特定できないため、明らかに欠落している階層を説明してください。
この場合は "Prof. Zoltan Spakovszky" という、必要なテキストを含むタグです。
どんな助けでも大歓迎です。
public void getHomePageLinks()
{
String html = "http://ocw.mit.edu/courses/aeronautics-and-astronautics/16-050-thermal-energy-fall-2002/";
org.jsoup.nodes.Document doc = Jsoup.parse(html);
Elements bodies = doc.select("body");
for(Element body : bodies )
{
System.out.println(body.getAllElements());
}
}
出力は次のとおりです。
http://ocw.mit.edu/courses/aeronautics-and-astronautics/16-050-thermal-energy-fall-2002/
ドキュメントの body タグ内のすべての要素を出力することになっていませんか?