0

https asp サイトから一部のコンテンツをスクレイピングするために機械化しようとすると、200 が返されるため、ログイン ページの送信が機能しているように見えます。セッションの有効期限が切れたというエラーでログイン ページに戻りました。最後の印刷は、リダイレクトされたことを確認できるようにするためのものです。

import mechanize 

USER_AGENT = "Mozilla/5.0 (X11; U; Linux i686; tr-TR; rv:1.8.1.9) Gecko/20071102 Pardus/2007 Firefox/2.0.0.9"

mech = mechanize.Browser()
mech.addheaders = [("User-agent", USER_AGENT)]

mech.open("https://www.example.com/login.asp")

mech.select_form("loginform")
mech['id'] = "blah"
mech['pin'] = "blah"
response = mech.submit()

trueContent = mech.open("https://www.example.com/content")

print trueContent.geturl()
4

1 に答える 1

1

あなたのコードは私には良さそうに見えますが、ログインが成功したというチェックはありません

response = mech.submit()

応答の内容を見て、ログインが成功したことを確認します。

このサイトは JavaScript なしで動作しますか? JavaScript によって設定された非表示フィールドが存在する可能性があります。

于 2011-10-14T09:47:29.107 に答える