基本的に私の学生データでは、ご覧のとおり、データに奇妙なサムボールが表示されるという問題がありますMAIN £1.00
。MAIN £1.00
以下は、学生割引のために特定の学生情報について Web サイトをスクレイピングし、最終的にファイルに書き込むコードのスニペットです。
# -*- coding: utf-8 -*-
totals = main.find_all('p')
for total in totals:
if total .find(text=re.compile("Main:")):
total = total.get_text()
if u"Main £" in total:
pull1 = re.search(r'(MAIN) (\D\w+\D\d+)', total)
pull2 = re.search(r'(MAINER) (\D\w+\D\d+)', total)
if pull1:
rpr_data.append(pull1.group(0).title())
print pull1.group(0).title()
if pull2:
rpr_data.append(pull2.group(0).title())
print pull2.group(0).title()
with open('RPR.txt','w') as rpr_file:
rpr_file.write('\n'.join(rpr_data).encode("UTF-8"))
スクリプトでこのデータを再利用しようとすると、テキストファイルから csv への 3 つの変数を照合し、一致した行の csv に変数を書き込むと、CSV に書き込むときにテキストファイルのデータに奇妙なÂ
シンボルがなくても、シンボルが戻ってきます。 ..
Â
このシンボルを正しく永久に根絶するにはどうすればよいですか?