python - テキストをファイルにエンコードする/エンコードされたテキストを正しく読み取ってÂ記号を根絶しますか?

Question

基本的に私の学生データでは、ご覧のとおり、データに奇妙なサムボールが表示されるという問題がありますMAIN Â£1.00。MAIN £1.00

以下は、学生割引のために特定の学生情報について Web サイトをスクレイピングし、最終的にファイルに書き込むコードのスニペットです。

# -*- coding: utf-8 -*-             
totals = main.find_all('p')
for total in totals:
    if total .find(text=re.compile("Main:")):
        total = total.get_text()
        if u"Main £" in total:
            pull1 = re.search(r'(MAIN) (\D\w+\D\d+)', total)
            pull2 = re.search(r'(MAINER) (\D\w+\D\d+)', total)
            if pull1:
                rpr_data.append(pull1.group(0).title())
                print pull1.group(0).title()
            if pull2:
                rpr_data.append(pull2.group(0).title())
                print pull2.group(0).title()
with open('RPR.txt','w') as rpr_file:
    rpr_file.write('\n'.join(rpr_data).encode("UTF-8"))

スクリプトでこのデータを再利用しようとすると、テキストファイルから csv への 3 つの変数を照合し、一致した行の csv に変数を書き込むと、CSV に書き込むときにテキストファイルのデータに奇妙なÂシンボルがなくても、シンボルが戻ってきます。 ..

Âこのシンボルを正しく永久に根絶するにはどうすればよいですか?

python - テキストをファイルにエンコードする/エンコードされたテキストを正しく読み取ってÂ記号を根絶しますか?

1 に答える 1

Related

Reference