1

レンディングクラブのダウンロードデータのURL欄から現在のローンノートのステータスをスクレイピングしようとしています。たとえば、https://lendingclub.com/browse/loanDetail.action?loan_id=104046830 の場合、情報を抽出するにはログインが必要です。

ログイン セッションを作成する手順に従いましたが、正常にログインできないようです。結果に正しいコードが含まれていません。誰かが問題を特定するのを手伝ってくれますか?

USERNAME = "username"
PASSWORD = "password"

LOGIN_URL = "https://www.lendingclub.com/auth/login?"

loan_id=96490539

URL = "https://lendingclub.com/browse/loanDetail.action?loan_id=96490539"

def main():
    session_requests = requests.session()

    # Get login csrf token
    result = session_requests.get(LOGIN_URL)
    tree = html.fromstring(result.text)
    authenticity_token = tree.xpath("//meta[@name='csrf-token']/@content")[0]

    # Create payload
    payload = {
        "login_email": USERNAME, 
        "login_password": PASSWORD, 
        "csrf-token": authenticity_token
    }

    # Perform login
    result = session_requests.post(LOGIN_URL, data = payload, headers = dict(referer = LOGIN_URL))

    # Scrape url
    result = session_requests.get(URL, headers = dict(referer = URL))
    return result
4

1 に答える 1