ページをクロールしようとしていますが、UnicodeDecodeError があります。これが私のコードです:
def soup_def(link):
req = urllib2.Request(link, headers={'User-Agent' : "Magic Browser"})
usock = urllib2.urlopen(req)
encoding = usock.headers.getparam('charset')
page = usock.read().decode(encoding)
usock.close()
soup = BeautifulSoup(page)
return soup
soup = soup_def("http://www.geekbuying.com/item/Ainol-Novo-10-Hero-II-Quad-Core--Tablet-PC-10-1-inch-IPS-1280-800-1GB-RAM-16GB-ROM-Android-4-1--HDMI-313618.html")
そしてエラー:
UnicodeDecodeError: 'utf8' codec can't decode byte 0xff in position 284: invalid start byte
さらに数人のユーザーに同じエラーが発生していることを確認しましたが、解決策がわかりません。