jSoupを使用して、ノードでこのHTMLスニペットを見つけるにはどうすればよいですか。
<span style="font-weight: bold">Party Date:</span> 14.08.2012<br>
HTMLスニペットから日付を抽出したいと思います。問題は、このHTMLスニペットは要素内のどこにでも発生する可能性があるため、含まれているテキストを使用して一致させる必要があることです。
あなたがまだjsoupセレクタークエリを探しているなら..これは私のために働きます..
String html = "<span style=\"font-weight: bold\">Party Date:</span> 14.08.2012<br>";
System.out.println("Date " + Jsoup.parse(html).select("span:matchesOwn(Party Date:)").first().nextSibling().toString());
質問に「xpath」のタグを付けたので、XPATHソリューションを受け入れると仮定します。反対の情報がない場合、私はいくつかの合理的な仮定をします。これらの仮定を修正または改善したい場合は、お知らせください。
次のXPATH式...
//span[.='Party Date:'][1]/following-sibling::text()
...戻り値...
' 14.08.2012'
注:これはXPATH1.0とXPATH2.0の両方で機能します