私は数か月前から Web スクレイピングを行っていますが、常に JavaScript を使用してデータをロードするページでスタックします。
私は HTMLunit を使用してそのようなページである程度の成功を収めていますが、Htmlunit がこれらの異常な例外をスローし、最終的にページをロードしないことがあります。HTMLunit を使用するのは失敗と失敗の連続だったと言わざるを得ません。
それを達成するための具体的な方法はありますか??
しかし、私の側でも、HTMLunit について深く掘り下げていません。それで、あなたの提案は何でしょうか?? 私はHTMLunitを使い続ける必要がありますか、それともjavascript処理を実現するための他の良い方法(ライブラリ)はありますか??
記録のために、私は Java を主要言語として使用しています。