あるプロジェクトでスクレイピーを使用しようとしています。https://text.westlaw.com/signon/default.wl?RS=ACCS10.10&VR=2.0&newdoor=true&sotype=mupの認証システムをバイパスするのに問題があります。この問題を理解するために、簡単なリクエスト ハンドラを作成しました。
import cookielib, urllib2
cj = cookielib.CookieJar()
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))
opener.addheaders = [('User-Agent', 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_8_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/30.0.1599.101 Safari/537.36'),]
url='https://text.westlaw.com/signon/default.wl?RS=ACCS10.10&VR=2.0&newdoor=true&sotype=mup'
r = opener.open(url)
f = open('code.html', 'wb')
f.write(r.read())
f.close()
返された html コードには、フォーム要素が含まれていません。私が偽のブラウザではないことをサーバーに納得させる方法を誰かが知っているので、認証を続けることができますか?