私はこのコードを持っています:
# -*- coding: utf-8 -*-
import codecs
prefix = u"а"
rus_file = "rus_names.txt"
output = "rus_surnames.txt"
with codecs.open(rus_file, 'r', 'utf-8') as infile:
with codecs.open(output, 'a', 'utf-8') as outfile:
for line in infile.readlines():
outfile.write(line+prefix)
そして、出力ファイルにちょっとした中国語のテキストが表示されます。私がそれをしようとしてもoutfile.write(line)
、出力に同じがらくたが表示されます。私はそれを理解していません。
目的: 男性の姓の巨大なファイルがあります。女性の姓の同じファイルを取得する必要があります。ロシア語では、次のようになります。Ivanov - Ivanova | Иванов - Иванова