12

jsoup を使用して、各タグの後にテキストを抽出したいと考えています。それを直接選択する方法はありますか、または全体で .substring を実行する必要がありますか?

<div>
<a href="#"> I don't want this text </a> 
**I want to retrieve this text**
</div>
4

4 に答える 4

29
public static void main(String... args) throws IOException {

    Document document = Jsoup.parse("<div>"
            + "<a href=\"#\"> I don't want this text </a>"
            + "**I want to retrieve this text**" + "</div>");

    Element a = document.select("a").first();

    Node node = a.nextSibling();
    System.out.println(node.toString());
}

出力

**I want to retrieve this text**
于 2013-04-25T16:04:44.190 に答える
0

はい、できます。

  1. <div>最初にの html を取得し、次にその html を使用して選択します.html()
  2. 要素を取得<a>し、その html を取得します
  3. <a>要素の htmlの長さを取得する
  4. 最初の部分を除外します。
于 2013-04-25T16:05:02.160 に答える
0
   Document doc = Jsoup.parse("<div>"
            + "<a href=\"#\"> I don't want this text </a>"
            + "**I want to retrieve this text**" + "</div>"); 

   Elements tags = doc.getElementsByTag("a");

   for(Element tag : tags) {
      System.out.println(tag.text());
   }
于 2018-08-09T10:45:45.223 に答える