重複の可能性:
JavaScript 対応のクローラーを作成する
JavaScript を使用してレンダリングするページを処理できる PHP ベースの Web スクレーパーの基礎として何を使用するかを理解しようとしています。多くの Web サイトのスクレイピング試行 (少なくとも私が処理するもの) は、それらのページの JS が実行されない限り失敗します。ページは、スクリプトなしの実装に正常にフォールバックするようには構築されていません。これには、AJAX を多用するものも含まれます。
最新の JavaScript に大きく依存する Web ページを処理できる Web スクレーパーの開発をどこから始めるべきかについて、誰か提案がありますか?
PHPで使えるものがベストです。