私は過去のオリンピックからメダルの勝者を引き出すためにBeautifulSoupを使用しています。いくつかのイベントやアスリートの名前でのアクセントの使用につまずきます。オンラインで同様の問題が投稿されているのを見てきましたが、Pythonを初めて使用し、コードに適用するのに問題があります。
スープをプリントするとアクセントが綺麗に見えます。しかし、スープの解析を開始すると(そして、CSVファイルに書き込むと)、アクセントのある文字が文字化けします。「LouisPerrée」は「LouisPerr√©e」になります
from BeautifulSoup import BeautifulSoup
import urllib2
response = urllib2.urlopen('http://www.databaseolympics.com/sport/sportevent.htm?sp=FEN&enum=130')
html = response.read()
soup = BeautifulSoup(html)
g = open('fencing_medalists.csv','w"')
t = soup.findAll("table", {'class' : 'pt8'})
for table in t:
rows = table.findAll('tr')
for tr in rows:
cols = tr.findAll('td')
for td in cols:
theText=str(td.find(text=True))
#theText=str(td.find(text=True)).encode("utf-8")
if theText!="None":
g.write(theText)
else:
g.write("")
g.write(",")
g.write("\n")
助けてくれて本当にありがとうございます。