現在、私はウェブクローラーに取り組んでいます。これは、いくつかの特定のサイトを解析し、xml ファイルに出力する必要があります。ここまでは、問題ありません。Crawler は機能し、cfg ファイルを介して非常に迅速にカスタマイズできます。Jsoup を使用して HTML コンテンツを解析します。
さらにいくつかのサイトを追加したところ、JavaScript で作成された HTML コンテンツに大きな問題があることに気付きました。Jsoup で Javascript をサポートする方法はありませんか? または、少なくともブラウザで表示できる完全な HTML コンテンツを取得します。
私はすでに HtmlUnit を試しましたが、これはうまくいきませんでした。ブラウザで取得できるコンテンツが表示されませんでした。
よろしくお願いいたします。
オゴフォ