私は次のようなhtmlファイルを持っています
...
<span itemprop="A">234</span>
...
<span itemprop="B">690</span>
...
これでは、値をAおよびBとして抽出したいと思います
。これを簡単に実行できるJava用のhtmlパーサーライブラリを提案できますか?
私は次のようなhtmlファイルを持っています
...
<span itemprop="A">234</span>
...
<span itemprop="B">690</span>
...
これでは、値をAおよびBとして抽出したいと思います
。これを簡単に実行できるJava用のhtmlパーサーライブラリを提案できますか?
個人的には、JTidyよりもJSoupを好みます。CSS のようなセレクターがあり、ドキュメントははるかに優れています。JSoup を使用すると、次の行でこれらの値を簡単に抽出できます。
Document doc = Jsoup.connect("your_url").get();
Elements spans = doc.select("span[itemprop]");
for (Element span : spans) {
System.out.println(span.text()); // will print 234 and 690
}
JSoupは行く方法です。
JTidyは、紛らわしい名前が付けられているが、尊敬されているHTMLパーサーです。