1

私は次のようなhtmlファイルを持っています

...
<span itemprop="A">234</span>
...
<span itemprop="B">690</span>
...

これでは、値をAおよびBとして抽出したいと思います
。これを簡単に実行できるJava用のhtmlパーサーライブラリを提案できますか?

4

3 に答える 3

3

個人的には、JTidyよりもJSoupを好みます。CSS のようなセレクターがあり、ドキュメントははるかに優れています。JSoup を使用すると、次の行でこれらの値を簡単に抽出できます。

Document doc = Jsoup.connect("your_url").get();
Elements spans = doc.select("span[itemprop]");

for (Element span : spans) {
  System.out.println(span.text()); // will print 234 and 690
}
于 2012-08-15T14:21:16.877 に答える
1

http://jsoup.org/

JSoupは行く方法です。

于 2012-08-15T14:16:15.847 に答える
1

JTidyは、紛らわしい名前が付けられているが、尊敬されているHTMLパーサーです。

于 2012-08-15T14:17:18.737 に答える