-1

重複の可能性:
PHP アプリケーション内で別のサイトから JavaScript をレンダリングするにはどうすればよいですか?

これはサイトhttp://www.oferta.pl/strona_v2/gazeta_v2/です。このサイトは完全に JavaScript で構築されています。PHPとcurlを使ってスクレイピングしたい。現在、DOMXPath を使用しています。左側のメニューには、選択するカテゴリがいくつかあります。そこには「形」が見えません。curl を使用してそのフォームを送信し、出力ページを破棄するにはどうすればよいですか?

私は file_get_contents() のみを使用しました。すべてのページを取得するわけではありません。どうすれば続行できますか?

NB : http://www.html-form-guide.com/php-form/php-form-submit.html「フォーム」を持つこの例を見つけました。しかし、指定したサイトには「フォーム」がありません。

4

1 に答える 1

1

こすることはできません。それが可能だ。しかし、あまりにも難しいです。

  1. http リクエストを curl でシミュレートします。ajaxによるすべてのリクエストを確認し、シミュレートしてみてください。

  2. Javascript の実行をシミュレートします (この部分はほとんど不可能です)。一部のリクエストには、Javascript によって生成された値が含まれています。phpで行う必要があります。JS に複雑なアルゴリズムが実装されている場合は、v8javascript エンジンを呼び出すことができます。

于 2012-02-18T16:19:13.170 に答える