python - 文字列pythonから\xe2\ x80\xa6を削除します

Question

txtファイルがたくさんあるので、それらのテキストを置き換える必要があります。ほぼ全員がこのnon-asciiキャラクターを持っています（思っ"..."たのですが…同じではありません）試してみましreplace()たが出来ないので助けが必要です!! 前もって感謝します

score 4 · Accepted Answer

を使用codecs.open()してファイルを開くと、すべての文字列がunicodesとして取得され、処理がはるかに簡単になります。

score 2 · Accepted Answer

2

Unicode 型の文字列を使用します。例えば、

>>> print u'\xe2'.replace(u'\xe2','a')
a

于 2012-08-17T06:30:01.803 に答える

score -1 · Accepted Answer

問題は、これらの文字が無効strであることですunicode。

import re
re.sub(r'<string to repleace>','',text,re.U)

他のほとんどの答えも機能します

3 に答える 3