UTF-8
外国語でエンコードされた文字列 (たとえば、文字: )内の特定の文字のインデックス (またはインデックス) を見つけようとしていますش
。
unicode.find('ش')
、word.find(u'ش')
、word.find(u'\\uش')
および正規表現も試しましたが、re.compile(u'\\uش)
役に立ちませんでした。面白いことに、デバッグ モードの Visual Studio (IronPython を使用する私の IDE) ではword.find(u'\\uش')
、変数ウォッチ ウィンドウで正しいインデックスが返されますが、実際のコードでは返されません ( が返されますindex=-1
)。
次のコマンドを使用して、ファイルから文字列を読み取っています。
file= codecs.open(file,'r','utf-8')
足りないものはありますか?または、これにアプローチする別の方法はありますか?