1

PHP cURL を使用してhttps://www.iwgac.com/にログインし、Web サイトの製品価格を取得しようとしています。最初に、ログインを試みてから、ホームページをエコーし​​て、価格が表示されるかどうかを確認しました (製品の価格は、ログイン後にのみ表示されます)。

Web サイトがログインを受け付けていないようです (cookie.txt ファイルは変更されますが)。これは、stackoverflow で見つけた他の回答に基づいたコードです。

class Curl {

    public $cookieJar = "";

    // Make sure the cookies.txt file is read/write permissions
    public function __construct($cookieJarFile = 'cookie.txt') {
        $this->cookieJar = $cookieJarFile;
    }

    function setup() {
        $header = array();
        $header[0]  = "Accept: text/xml,application/xml,application/xhtml+xml,";
        $header[0] .= "text/html;q=0.9,text/plain;q=0.8,image/png,*/*;q=0.5";
        $header[]   = "Cache-Control: max-age=0";
        $header[]   = "Connection: keep-alive";
        $header[]   = "Keep-Alive: 300";
        $header[]   = "Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7";
        $header[]   = "Accept-Language: en-us,en;q=0.5";
        $header[]   = "Pragma: "; // browsers keep this blank.

        curl_setopt($this->curl, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows; U; Windows NT 5.2; en-US; rv:1.8.1.7) Gecko/20070914 Firefox/2.0.0.7');
        curl_setopt($this->curl, CURLOPT_HTTPHEADER, $header);
        curl_setopt($this->curl, CURLOPT_COOKIEJAR, $this->cookieJar);
        curl_setopt($this->curl, CURLOPT_COOKIEFILE, $this->cookieJar);
        //curl_setopt($this->curl, CURLOPT_AUTOREFERER, true);
        curl_setopt($this->curl, CURLOPT_FOLLOWLOCATION, true);
        curl_setopt($this->curl, CURLOPT_RETURNTRANSFER, true);
    }

    function get($url) {
        $this->curl = curl_init($url);
        $this->setup();

        return $this->request();
    }

    function getAll($reg, $str) {
        preg_match_all($reg, $str, $matches);
        return $matches[1];
    }

    function postForm($url, $fields, $referer = '') {
        $this->curl = curl_init($url);
        $this->setup();
        curl_setopt($this->curl, CURLOPT_URL, $url);
        curl_setopt($this->curl, CURLOPT_POST, 1);
        curl_setopt($this->curl, CURLOPT_REFERER, $referer);
        curl_setopt($this->curl, CURLOPT_POSTFIELDS, $fields);
        return $this->request();
    }

    function getInfo($info) {
        $info = ($info == 'lasturl') ? curl_getinfo($this->curl, CURLINFO_EFFECTIVE_URL) : curl_getinfo($this->curl, $info);
        return $info;
    }

    function request() {
        return curl_exec($this->curl);
    }
}

$curl = new Curl();

$url = "http://www.iwgac.com/index.php";
$fields = "form_name='main_login_form'&return_url='index.php'&user_login='**'&password='**'&remember_me='Y'&dispatch[auth.login]='Sign in'";

$html = $curl->postForm($url, $fields, $referer);
$html = curl_init();
curl_setopt($html, CURLOPT_COOKIE, 'cookie.txt');
curl_setopt($html, CURLOPT_COOKIEFILE, 'cookie.txt');
curl_setopt($html, CURLOPT_URL, 'http://www.iwgac.com');
$html = curl_exec($html);
echo $html; 

この問題を解決するためのアイデアはありますか?

4

1 に答える 1

1

いつものように、基本:

  1. セットするcurl_setopt($this->curl, CURLOPT_AUTOREFERER, true);
  2. フォームを送信する前にログインページにアクセスしてください

そして高度:HttpFoxのようなブラウザアドオンを使用します:

  1. 送信された正確なヘッダーと投稿データを確認してください。あなたがしていることから保護するためにjavascriptによって追加された隠された値がしばしばあります
  2. 正確なCookieを参照してください。これらは、ページ自体がロードされた後にロードされるファイルによって割り当てることができます。curlに含まれるすべてのファイルを要求することはできません。
于 2012-12-16T08:46:43.913 に答える