0

次のようなテーブルを含むページがあります。

<html>
<ol>
<li>entry1</li>
<li>entry2</li>
<li>entry3</li>
<li>entry4</li>
</ol>   
</html>

ページ上の「エントリ」の発生をカウントし、それぞれがテーブルのどの行に配置されているか (ここでは 1 行目) を抽出したいと考えています。

このタスクを実行する Java ツールはありますか? カウントを検索するには、RegEx と Matcher パターンを使用します。しかし、そのドキュメントから表の行を抽出するにはどうすればよいでしょうか?

4

2 に答える 2

2

これにはJSoupを使用できます。JSoup を使用すると、HTML から情報を簡単に抽出できます。

于 2012-11-23T13:03:01.803 に答える
0

または、追加のライブラリを使用したくない場合は、正規表現http://www.w3schools.com/jsref/jsref_obj_regexp.aspを使用できます

于 2012-11-23T13:05:51.697 に答える