リクエスト ライブラリ ( http://docs.python-requests.org/en/latest/ ) を調べているところですが、リクエストを使用して Cookie を含むページを取得する方法に問題がありました。
例えば:
url2= 'https://passport.baidu.com'
parsedCookies={'PTOKEN': '412f...', 'BDUSS': 'hnN2...', ...} #Sorry that the cookies value is replaced by ... for instance of privacy
req = requests.get(url2, cookies=parsedCookies)
text=req.text.encode('utf-8','ignore')
f=open('before.html','w')
f.write(text)
f.close()
req.close()
上記のコードを使用してページを取得すると、ログインページがログインページではなく「before.html」に保存されるだけで、実際には正常にログインしていないことがわかります。
しかし、URLlib2 を使用してページをフェッチすると、期待どおりに正しく動作します。
parsedCookies="PTOKEN=412f...;BDUSS=hnN2...;..." #Different format but same content with the aboved cookies
req = urllib2.Request(url2)
req.add_header('Cookie', parsedCookies)
ret = urllib2.urlopen(req)
f=open('before_urllib2.html','w')
f.write(ret.read())
f.close()
ret.close()
これらのコードを使用すると、ログインしたページが に保存されbefore_urllib2.html
ます。
--
コードに間違いはありますか? どんな返信でも感謝します。