UTF-8外国語でエンコードされた文字列 (たとえば、文字: )内の特定の文字のインデックス (またはインデックス) を見つけようとしていますش。
unicode.find('ش')、word.find(u'ش')、word.find(u'\\uش')および正規表現も試しましたが、re.compile(u'\\uش)役に立ちませんでした。面白いことに、デバッグ モードの Visual Studio (IronPython を使用する私の IDE) ではword.find(u'\\uش')、変数ウォッチ ウィンドウで正しいインデックスが返されますが、実際のコードでは返されません ( が返されますindex=-1)。
次のコマンドを使用して、ファイルから文字列を読み取っています。
file= codecs.open(file,'r','utf-8')
足りないものはありますか?または、これにアプローチする別の方法はありますか?