2

このページから R で始まる単語 (動詞) を抽出しようとしています。ただし、次のコードを実行すると:

from bs4 import BeautifulSoup
import urllib2
url = "http://www.usingenglish.com/reference/phrasal-verbs/r.html"
content = urllib2.urlopen(url).read()
soup = BeautifulSoup(content)
print soup.prettify()

スローされたエラーは次のようなものでした:

UnicodeEncodeError: 'charmap' コーデックは位置 57801 の文字 u '\xa9' をエンコードできません: 文字は未定義にマップされます

誰かがエラーの内容と、修正して続行する方法を教えてもらえますか?

4

1 に答える 1

7

スタック トレース全体、または少なくともどの行を指しているかを示していただけると、はるかに簡単になります。

とにかく、問題は最後の行にあります。次のように変更します。

print(soup.prettify().encode('utf-8'))
于 2013-06-12T08:55:09.327 に答える