java - JAVAでXpathを使用してHTMLファイルを解析する

翻译自：https://stackoverflow.com/questions/30279171 2015-05-16T18:18:54.237

1615 次

URL のソースを読み取ってファイル (source.html) に保存できる Java コードがあり、保存されたページから XPath を使用して値を抽出したいと考えています。価格を読みたいとします -//div [@itemprop='price'] //text ()

これをさらに行うには、保存した HTML ページで直接これを行うことができますか、それともまずこれを XML ファイルに変換してから XPath を使用する必要があります。HTMLクリーナー/パーサーについて聞いたことがありますが、ここで使用する必要がありますか? 回答を求めて別の Web サイトを参照しないでください。その場合は、直接的で簡単なレッスンができる場所に私を転送してください。以下のコードを変更すると、非常に役立ちます。

import java.io.FileWriter;
import java.io.IOException;
import java.io.PrintWriter;

import org.jsoup.Jsoup;

public class jSoupContentRead {
    @SuppressWarnings("resource")
    public static void main(String[] args) throws IOException {
        FileWriter FR = new FileWriter("source.html");
        PrintWriter op = new PrintWriter(FR);

        org.jsoup.nodes.Document doc = Jsoup.connect(
                "http://itunes.apple.com/us/book/a-way-home/id982665320?mt=11")
                .get();

        op.write(doc.toString());
        System.out.println(doc.toString());
    }
}

java - JAVAでXpathを使用してHTMLファイルを解析する

1 に答える 1

Related

Reference