java - htmlを解析する方法

Question

Java HtmlParserをダウンロードしましたが、API を使用して HTML データを抽出する方法がわかりません。私がそれに取り組むことができるように、いくつかの例を挙げてもらえますか?

score 2 · Accepted Answer

あなたはHtmlParserについて話しているのですか？むしろ、Jsoupのような冗長性の少ないAPIを備えたパーサーを選択してください。学ぶ必要があるのは、平均的なフロントエンド開発者にとってすでに十分に明らかなCSSセレクターだけです。

これは、現在の質問とすべての回答者の名前を表示するキックオフの例です。

package com.stackoverflow.q3416036;

import java.net.URL;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

public class Test {

    public static void main(String[] args) throws Exception {
        URL url = new URL("https://stackoverflow.com/questions/3416036");
        Document document = Jsoup.parse(url, 3000);

        String question = document.select("#question .post-text").text();
        System.out.println("Question: " + question);

        Elements answerers = document.select("#answers .user-details a");
        for (Element answerer : answerers) {
            System.out.println("Answerer: " + answerer.text());
        }
    }

}

参照：

JavaでのHTMLパーサーの長所と短所

java - htmlを解析する方法

1 に答える 1

参照：

Related

Reference