私がスクリーンスクレイピングしていたサイト(私がクレジットを持っている)は最近サーバーを変更し、ポート80をブロックしました。httpsにポート443を使用できると思っていましたが、タイムアウトエラーが発生しました。新しいWWW::Mechanizeオブジェクトを作成し、get()を使用してサイトをスクレイプしています。
私の質問は、httpsを使用するようになったのでCookieを追加する必要がありますか?
これはクッキージャーを追加する正しい方法ですか?
my $agent = WWW::Mechanize->new();
$agent->agent('Mozilla/5.0 (X11; U; Linux x86_64; en-US; rv:1.9.2.3) Gecko/20100407 Ubuntu/9.10 (karmic) Firefox/3.6.3');
# we need cookies
$agent->cookie_jar(HTTP::Cookies->new);
これはエラーです:
ログインしようとしています...2010-04-2214 :00:08 POSTの
エラー
https:// theURL / j_security_check:
ログインプロセスに許可された時間を超えました。続行する場合は、もう一度クリックして要求したリンクを再度クリックするか、ブラウザを閉じて再度開きます(lib / mypackage.pmの40行目)。
これはCookieの問題でもありますか?
ブラウザでサイトにログインしても、ログインまでに60〜90秒かかるように感じますが、ログイン時間を長くする方法はありますか?