0

を使用して、ここにリクエストを送信しようとしていますrequests-html

これが私のコードです:

headers = {"User-agent":"Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/47.0.2526.80 Safari/537.36"}
session = HTMLSession()
while True:
   try:
       r = session.get("https://www.size.co.uk/product/white-fila-v94m-low/119095/",headers=headers,timeout=40)
       r.html.render()
       print(r.html.text)

   except Exception as e:
       print(e)

これが私が受け取っているエラーです:

HTTPSConnectionPool(host='www.size.co.uk', port=443): Read timed out. (read timeout=40)

ユーザー エージェントを設定すると問題が解決すると思いましたが、まだエラーが表示されますか? タイムアウトを増やしてもうまくいかない

4

1 に答える 1

0

これは非同期で行うことができます

from requests_html import AsyncHTMLSession

s = AsyncHTMLSession()
async def main():
    r = await s.get('https://www.size.co.uk/product/white-fila-v94m-low/119095/')
    await r.html.arender()
    print(r.content)

s.run(main)
于 2019-08-23T18:49:23.730 に答える