私のプロジェクトでは、2 つの問題があります。
- 8/10回承り
HTTP Error 503: Service Temporarily Unavailable
ます。 - 反復を正しく実行していますか?
呼び出されたクラスを探してclass="torType"
、リンク URL を取得する必要があります。うまく機能していますが、正しく実行していますか?
#import urllib.request
#from bs4 import BeautifulSoup
WebUrl = 'http://kickasstorrents.come.in/tv/'
def RetrieveWebData(MyUrl):
try:
opener = urllib.request.build_opener()
opener.addheaders =[('User-agent','Mozilla/5.0')]
url = (MyUrl)
page = opener.open(url).read()
return page
except OSError as e:
print("An error occurred reading the webpage ",e)
def FilterWebData(RawData):
try:
soup = BeautifulSoup(RawData)
TorData = soup.find_all("a", {"class" : "torType"})
soup = BeautifulSoup(str(TorData))
for link in soup.find_all('a'):
RecentTors = link.get('href')
return RecentTors
except OSError as e:
print("An error occurred during filtering",e)
RawPage = RetrieveWebData(WebUrl)
RecentTorrentLinks = FilterWebData(RawPage)
print(RecentTorrentLinks)