2

txtファイルがたくさんあるので、それらのテキストを置き換える必要があります。ほぼ全員がこのnon-asciiキャラクターを持っています(思っ"..."たのですが…同じではありません)試してみましreplace()たが出来ないので助けが必要です!! 前もって感謝します

4

3 に答える 3

4

を使用codecs.open()してファイルを開くと、すべての文字列がunicodesとして取得され、処理がはるかに簡単になります。

于 2012-08-17T06:27:57.103 に答える
2

Unicode 型の文字列を使用します。例えば、

>>> print u'\xe2'.replace(u'\xe2','a')
a
于 2012-08-17T06:30:01.803 に答える
-1

問題は、これらの文字が無効strであることですunicode

import re
re.sub(r'<string to repleace>','',text,re.U)

他のほとんどの答えも機能します

于 2012-08-17T06:34:08.137 に答える