txtファイルがたくさんあるので、それらのテキストを置き換える必要があります。ほぼ全員がこのnon-ascii
キャラクターを持っています(思っ"..."
たのですが…同じではありません)試してみましreplace()
たが出来ないので助けが必要です!! 前もって感謝します
質問する
8851 次
3 に答える
4
を使用codecs.open()
してファイルを開くと、すべての文字列がunicode
sとして取得され、処理がはるかに簡単になります。
于 2012-08-17T06:27:57.103 に答える
2
Unicode 型の文字列を使用します。例えば、
>>> print u'\xe2'.replace(u'\xe2','a')
a
于 2012-08-17T06:30:01.803 に答える
-1
問題は、これらの文字が無効str
であることですunicode
。
import re
re.sub(r'<string to repleace>','',text,re.U)
他のほとんどの答えも機能します
于 2012-08-17T06:34:08.137 に答える