UTF-8、ASCII、および Unicode の違いを理解しようとしています。Unicode、UTF、ASCII、ANSI 形式の違いについては既に読みました。しかし、Python からエラーが発生しています。文字列がどのような形式であるかを確認する方法がわかりません。
例えば:
1# 'Klaus-Groth-Straße, Ballahausen'
2# 'Capit\xe1n\n'
3# u'Capit\xe1n\n'
だと思います
u'
3# = ?による Unicode- 1#=?
- 2#=?
私はすでに文字列 #1 をファイルに書き込もうとして、自分で小さな関数を書きました
def escape(html):
html=html.replace('ö','ö')
html=html.replace('Ö','Ö')
html=html.replace('ä','ä')
html=html.replace('Ä','Ä')
html=html.replace('ü','ü')
html=html.replace('Ü','Ü')
html=html.replace('ß','ß')
return html
文字列をtxt
ファイルに書き込む前に、文字を置き換えて、テキスト ファイルで正しいスペルを取得したいと考えています ( Klaus-Groth-Straße、Buchholz in der Nordheide )。
しかし、それは機能していません:/
私の 3 つの例が属する文字列の種類を教えてください - Unicode、ASCII、または UTF-8 ですか? txt
#1 のような文字列を使用して、正しいスペルを a に書き込むにはどうすればよいでしょうか?