0

ここに私の現在のコードがあります:

html = urllib.request.urlopen(url)
soup = BeautifulSoup(html)
title = soup.find('title')[7:(title.len()-7)]
return title

これでウィキペディアのようなウェブサイトにクエリを実行すると、403 でクラッシュします。これについて何ができますか? (python3を使用)

4

2 に答える 2

4

ウィキペディアは、サイトをスクレイピングすることを望んでいません。彼らはあなたがこすり落としていると信じているので、あなたに仕えることを拒否しています、そして彼らは正しいです.

于 2012-06-18T20:47:35.710 に答える