現在、多くの Web サイトには ajax によってロードされたコンテンツが含まれています (例: 一部のビデオ Web サイトのコメント)。通常、これらのデータをクロールすることはできません。得られるのは、一部の js ソース コードだけです。ここで質問です。html 応答を取得して目的の最終ページに到達した後、JavaScript コードをどのように実行できますか?
HtmlUnit にはバックグラウンド js を実行する機能があることは知っていますが、多くのバグやエラーが存在します。他に役立つツールはありますか?
ajax リクエストの URL をクロールし、そのパラメーターを分析し、リクエストを再送信してデータを取得できると言う人もいます。上記の方法で問題が解決しない場合、ajax URL を抽出して正しい形式でリクエストを送信する方法を誰か教えてもらえますか?
ちなみに言語はJavaがベスト