5

jSoupを使用して、ノードでこのHTMLスニペットを見つけるにはどうすればよいですか。

<span style="font-weight: bold">Party Date:</span> 14.08.2012<br>

HTMLスニペットから日付を抽出したいと思います。問題は、このHTMLスニペットは要素内のどこにでも発生する可能性があるため、含まれているテキストを使用して一致させる必要があることです。

4

2 に答える 2

14

あなたがまだjsoupセレクタークエリを探しているなら..これは私のために働きます..

    String html = "<span style=\"font-weight: bold\">Party Date:</span> 14.08.2012<br>";

    System.out.println("Date " + Jsoup.parse(html).select("span:matchesOwn(Party Date:)").first().nextSibling().toString());
于 2012-08-20T20:45:51.457 に答える
1

質問に「xpath」のタグを付けたので、XPATHソリューションを受け入れると仮定します。反対の情報がない場合、私はいくつかの合理的な仮定をします。これらの仮定を修正または改善したい場合は、お知らせください。

仮定

  1. は、テキスト値が「Party Date:」のドキュメント内の1つのスパン要素です。
  2. 'Part Date:'テキストはそのままです。先頭または末尾の空白や大文字小文字の変化は絶対にありません。
  3. 上記のスパンに続くテキストノードには、ターゲット値が含まれています。
  4. 上記のスパン要素は、ドキュメント内のどこにでも出現する可能性があります。
  5. style属性は、質問には重要ではありません。

XPath式

次のXPATH式...

//span[.='Party Date:'][1]/following-sibling::text()

...戻り値...

' 14.08.2012'

注:これはXPATH1.0とXPATH2.0の両方で機能します

于 2012-08-15T11:55:37.750 に答える