0

私はcurlを使用してページをスクラップしようとしていますが、ユーザーがIE6より上位のブラウザーでこのページにアクセスすると、ほとんどのページテキストにjavascriptが入力され、空の要素が返されます。

私のアイデアは、ユーザーエージェントをIE6に変更するか、可能であればJSをオフにするという私のカールコールにありました。curlがサーバー側であることは知っていますが、JSがオフであるか、ブラウザーがIE6であるかのように動作する方法があるはずです。

私が今私のユーザーエージェントを持っている方法は次のとおりです:

$userAgent = "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US) AppleWebKit/525.13 (KHTML, like Gecko) Chrome/0.A.B.C Safari/525.13";

私はそれを設定した人ではありませんでした。どこかにダウンロードしました。上記をどのように行うことができますか?

4

2 に答える 2

0

その行を次のように変更してみてください。

$userAgent = "Mozilla/5.0 (compatible; MSIE 6.0; Windows NT 5.1)";

それがうまくいくかどうか教えてください。

于 2013-02-11T06:39:00.097 に答える
-2

これを試して:

$opts = array("Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US) AppleWebKit/525.13 (KHTML, like Gecko) Chrome/0.A.B.C Safari/525.13");

curl_setopt( $ch, CURLOPT_HTTPHEADER, $opts );

お役に立てれば。

于 2013-02-11T06:27:34.650 に答える