私の問題は、正規表現とre.search()を使用しているPythonが、utf-8を使用していてもアクセントを認識しないことです。これが私のコード文字列です。
#! /usr/bin/python
-*- coding: utf-8 -*-
import re
htmlString = '</dd><dt> Fine, thank you. </dt><dd> Molt bé, gràcies.'
SearchStr = '(\<\/dd\>\<dt\>)+ ([\w+\,\.\s]+)([\&\#\d\;]+)(\<\/dt\>\<dd\>)+ (\w+) (\w+)'
Result = re.search(SearchStr, htmlString)
if Result:
print Result.groups()
passavol23:jO$ catalanword.py
('</dd><dt>', 'Fine, thank you.', ' ', '</dt><dd>', 'Molt', 'b')
したがって、問題は、éを認識せずに停止することです。どんな助けでもいただければ幸いです。Pythonの初心者です。