0

大学の Web サイトからデータを収集するためのボットを作成する必要があります。ボットは、regno フィールドと captcha フィールドを使用して単純なログインを使用します。実際のキャプチャは使用せず、偽物です (ページ ソースで確認できます)。だから私の考えは、DOMパーサーを使用して、例えばからフェッチすることです

この仕事をするためにPHP-Curlを使用しています。私のコード:`

<?
$ch = curl_init();
$captch = i will get the value from DOM Parser ( But here is the problem , i have to get it before even executing the page !! ) 
$fields = "regno=11BTA00&captcha=$captcha";
curl_setopt($ch,CURLOPT_URL,$loginurl);
curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);
curl_setopt($ch,CURLOPT_POSTFIELDS,$fields);
$data = curl_exec($ch);
curl_close($ch);
?>

問題は、一度curl_execを実行し、解析してcaptcaを取得し、それを送信するために再度curl_execを実行する必要があるため、captchaのリロードが発生することです..

これに対する回避策はありますか? cURL以外?別のライブラリを使用する準備ができました

4

0 に答える 0