7

Mediawiki api を使用して、ウィキペディアにログインし、ユーザー ページでいくつかのアクションを実行するための簡単なスクリプトを作成しようとしています。ただし、最初のログイン要求を通過することはないようです (このページから: https://en.wikipedia.org/wiki/Wikipedia:Creating_a_bot#Logging_in )。設定したセッション Cookie が送信されていないようです。これまでの私のコードは次のとおりです。

import Cookie, urllib, urllib2, xml.etree.ElementTree

url = 'https://en.wikipedia.org/w/api.php?action=login&format=xml'
username = 'user'
password = 'password'

user_data = [('lgname', username), ('lgpassword', password)]

#Login step 1
#Make the POST request
request = urllib2.Request(url)
data = urllib.urlencode(user_data)
login_raw_data1 = urllib2.urlopen(request, data).read()

#Parse the XML for the login information
login_data1 = xml.etree.ElementTree.fromstring(login_raw_data1)
login_tag = login_data1.find('login')
token = login_tag.attrib['token']
cookieprefix = login_tag.attrib['cookieprefix']
sessionid = login_tag.attrib['sessionid']

#Set the cookies
cookie = Cookie.SimpleCookie()
cookie[cookieprefix + '_session'] = sessionid

#Login step 2
request = urllib2.Request(url)
session_cookie_header = cookieprefix+'_session='+sessionid+'; path=/; domain=.wikipedia.org; HttpOnly'

request.add_header('Set-Cookie', session_cookie_header)
user_data.append(('lgtoken', token))
data = urllib.urlencode(user_data)

login_raw_data2 = urllib2.urlopen(request, data).read()

問題はrequest.add_header('Set-Cookie', session_cookie_header)行のどこかにあると思いますが、確かなことはわかりません。これらの Python ライブラリを使用して、リクエストごとにヘッダーで Cookie を送信するにはどうすればよいですか (これは多くの API 関数に必要です)。

4

1 に答える 1

14

の最新バージョンは、セッションrequestsをサポートしています(非常に使いやすく、全体的に優れています)。

with requests.session() as s: 
    s.post(url, data=user_data)
    r = s.get(url_2)
于 2011-08-23T14:57:46.463 に答える