5

DOMパーサーとjsoupライブラリを使用してHTMLページを解析しようとしています。私が直面している問題はこれです:

Webサイトには、2つの異なるテーブルを表示する2つのボタンがあります。2番目のボタンがクリックされたときに表示されるテーブルを解析する必要があります。2番目のボタンをクリックした後に設定されるさまざまな属性値があります。

私がする時Jsoup.connect("example.com")

最初のボタンが選択されているような応答があり、そのデータは必要ありません。

2番目のボタンをクリックしてから、Webサイトからデータの解析と取得を開始する方法はありますか?

4

3 に答える 3

5

Jsoupは単なるパーサーです。つまり、ボタンのクリックなどのイベントを処理することはできません。この種の仕事を実行するためのブラウザ自動化ツール(Seleniumなど)を見てください。

于 2013-01-14T13:10:58.943 に答える
4

JSoupはHTMLパーサーであり、ブラウザーの代替ではありません。HTMLユニットを見てください

HtmlUnitは、「Javaプログラム用のGUIレスブラウザ」です。HTMLドキュメントをモデル化し、「通常の」ブラウザの場合と同じように、ページの呼び出し、フォームへの入力、リンクのクリックなどを可能にするAPIを提供します。

于 2013-01-14T13:11:00.833 に答える
4

JSoupはWebページを制御できず、コンテンツを解析するだけです。操作と相互作用のために、いくつかのツールがあります。私はGebをお勧めします。GebはJQueryのような構文でGroovyDSLを使用しており、非常に流暢です。また、xml/htmlを解析するのも非常に簡単です。

于 2013-01-14T13:13:25.760 に答える