次の html コードがあり、そこから日付を抽出しようとしています。Jsoup の select() メソッドを使用してそれを行うにはどうすればよいですか?
<span class="lead">Written on</span> 05.01.2013 at 12:16 <br />
ここ:
final String html = "<span class=\"lead\">Written on</span> 05.01.2013 at 12:16 <br />";
Document doc = Jsoup.parse(html);
for( Element element : doc.select("span.lead") )
{
// Simple output of the date; 'toString()' gives you the value
System.out.println(element.nextSibling().toString());
}
出力:
05.01.2013 at 12:16
説明:
doc.select("span.lead")
取得します。span
span
-tag を反復処理します (この例では 1 つだけです)。element.nextSibling()
の後に次のノードを取得すると、探しspan
ているテキストノード先頭の空白があるためtrim()
、それを削除するために使用できます。element.nextSibling().toString().trim()