0

Python のリクエスト ライブラリを使用してアカウントにアクセスするために POST データを送信できません。結果soupは、POST が送信されていない場合と同じです。これは、私が使用して別のサイトで作業したコードです。

def get_data(final_url):
    payload = {'session[email]':'myemail@myemail.com','session[password]':'mypwd','session[remember_me]':'0','commit':'Sign in'}
    with requests.session() as ses:
        log_soup = BeautifulSoup(ses.get('https://www.login-page.com/login').text)
        payload['utf8'] = log_soup.findAll('input',attrs={'name':'utf8'})[0].get('value')
        payload['authenticity_token'] = log_soup.findAll('input',attrs={'name':'authenticity_token'})[0].get('value')
        ses.post('https://www.login-page.com/login',data=payload)
        req = ses.get(final_url)

        soup = BeautifulSoup(req.text)

    return soup


<form accept-charset="UTF-8" action="/sign_in" class="main_form" id="new_session" method="post" novalidate="novalidate"><div style="margin:0;padding:0;display:inline"><input name="utf8" type="hidden" value="&#x2713;"/><input name="authenticity_token" type="hidden" value="l5+2s90FtEUsS3GHlr2tAktcxSW8jqgXx3mXEwIlAzE="/></div><div class="error_message">
</div>
<dl>
<dt><label for="session_email">Email</label></dt>
<dd>
<div class="input_border"><input autofocus="autofocus" class="text required email" id="session_email" name="session[email]" placeholder="Email" size="30" type="email"/></div>
</dd>
</dl>
<dl>
<dt><label for="session_password">Password</label></dt>
<dd>
<div class="input_border"><input class="text required" id="session_password" name="session[password]" placeholder="Password" size="30" type="password"/></div>
</dd>
</dl>
<div class="checkbox_field"><input name="session[remember_me]" type="hidden" value="0"/><input id="session_remember_me" name="session[remember_me]" type="checkbox" value="1"/><label for="session_remember_me">Remember me</label></div>
<table class="buttons">
<tr>
<td><input class="button public" data-disable-with="Please wait..." name="commit" type="submit" value="Sign in"/></td>
<td class="forgot_password"><a href="/passwords/new">Forgot your password?</a></td>
</tr>
</table>
</form>

手動でログインした後に取得される POST データは次のとおりです。

utf8:✓
authenticity_token:l5+2s90FtEUsS3GHlr2tAktcxSW8jqgXx3mXEwIlAzE=
session[email]:myemail@myemail.com
session[password]:mypwd
session[remember_me]:0

ご助力ありがとうございます!

4

1 に答える 1

2

どのバージョンのリクエストを使用していますか? 0.14.x から 1.2.0 の間の場合は、1.2.0 にアップグレードする必要があります。セッションの Cookie はリダイレクトで正しく設定されず、1.2.0 でこれが修正されます。

もう 1 つの問題は、おそらく からの応答を確認する必要があるということですses.post(url, data=payload)。301 または 302 の行に沿って適切なステータス コード (この場合はリダイレクトを予期しているため) を受け取っていることを必ず確認する必要があります。

上記のすべてがチェックアウトされていると仮定すると、あなたのウェブサイトはいくつかのファンキーなUser-Agent分析を行っている可能性があり、ブラウザのユーザーエージェント文字列を使用してそれを確認することもできます。

ses.headers['User-Agent'] = '...'
response = ses.post(url, data=payload)
final_response = ses.get(final_url)
于 2013-05-10T19:43:20.487 に答える