Webページからデータを検索してスクレイピングし、データベースに貼り付けるための優れたオープンソースのJavaライブラリは何ですか. たとえば、次のようなページがあるとします。
<tr><td><b>Address:</b></td>
<td colspan=3>123 My Street </td></tr>
"Address:" がキーですが、実際には "123 My Street" を取得しようとしています。これには、html タグと間にスペースがたくさんあります。理想的には、文字列「Address:」に続く td の間の値を取得したいと考えています。JSoup は検索を実行できるようですが、オフセットを実行する方法の良い例は見当たりませんでした (見逃した可能性があります)。キー/値を処理するライブラリはありますか?
また、Kapow Extraction Browser に似た UI スクリプト作成のためのオープン ソース (MIT/Apache) のイニシアチブについても知りたいと思っています。
ありがとう。