0

商品を宣伝したくありません。

しかし、エラーは非常に具体的であり、他の方法で質問する方法がわかりません。

コード内にあるページAのメニューのリンクを取得したいのですが、そのページには別のページBが関連付けられています

メニューを読んでみると、Bページからメニューが入っているのですが、理由がわかりません。

HTMLでは、すべての関数とライブラリがドメインのページBにあることがわかります。

助言がありますか?

from bs4 import BeautifulSoup
import http.cookiejar, urllib.request

mainurl="http://uk.example.com"



cookijar = http.cookiejar.CookieJar()
opener = urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cookijar))
opener.addheaders = [('User-agent', 'Mozilla/5.0')]
mainPage = opener.open(mainurl)
mainPageRequest = mainPage.read()
mainPagesoup = BeautifulSoup(mainPageRequest)

menu=mainPagesoup.find("div", { "class" : "mainNavigation_linkList_content" })
print(menu)

http://uk.example.com とプログラムにhttp://uk.example.co.uk/メニューを読んでもらいたい

4

1 に答える 1

1

urllibは、サーバーが期待している方法でリダイレクトを処理していないようです。

最初のインストールリクエスト

pip install requests

次に、これを試してください:

import requests
from bs4 import BeautifulSoup

s = requests.Session()
mainPage = s.get("http://uk.accessorize.com")

mainPagesoup = BeautifulSoup(mainPage.text)
menu=mainPagesoup.find("div", { "class" : "mainNavigation_linkList_content" })
print(menu)
于 2013-02-05T01:21:46.740 に答える