python - unicode findall python

Question

私は英語の作業パターンを持っていますが、私の母国語は機能しておらず、頭痛の種になります。まず第一に、私はエンコーディングについて多くの質問をしました、そして私はそれを過小評価したことを知っています、それは大きな問題でした。私はそれについて読むのに少し時間を費やしました、そして問題はまだそこにあります。だから今、私は正規表現のutf問題に直面しています。したがって、パターンは次のとおりです。

exactMatch = re.compile(r"([^\.]*\bтурција\b[^\.]*)\.", re.UNICODE)
print exactMatch.pattern
result= exactMatch.findall("турција е на врвот од индустријата. турција е на врвот од индустријата.")

それは英語で動作します。段落内のすべての文を私に与えるのが機能です。だから何か提案はありますか？

エンコードとデコードも試しましたが、エンコードエラー以外は発生します。

score 6 · Accepted Answer

これは機能します：

exactMatch = re.compile(ur"([^\.]*\bтурција\b[^\.]*)\.", re.UNICODE)
print exactMatch.pattern
result= exactMatch.findall(u"турција е на врвот од индустријата. турција е на врвот од индустријата.")

Unicodeを使用する場合は、Unicodeを使用してください。

python - unicode findall python

1 に答える 1

Related

Reference