0

Python で次のコマンドを実行しようとしています。

data = "&city=Zayas de Báscones;Zayas de Báscones;"
arr = re.findall(ur'[&]{1}\w{4}=[a-zA-ZA-Za-z£€ßçÇáàâäæãåèéêëîïíìôöòóøõûüùúÿñÁÀÂÄÆÃÅÈÉÊËÎÏÍÌÔÖÒÓØÕÛÜÙÚŸÑðÐ]+(?:[\s-][a-zA-ZA-Za-z£€ßçÇáàâäæãåèéêëîïíìôöòóøõûüùúÿñÁÀÂÄÆÃÅÈÉÊËÎÏÍÌÔÖÒÓØÕÛÜÙÚŸÑðÐ]+)*',data)
x = "".join(arr)
x = x.split('&city=')
print x

結果:

['', 'Zayas de B?scones']

疑問符の代わりにユニコード文字を取得するにはどうすればよいですか? 文字列の先頭に 'u' 文字 (例: u'pattern') があり、パターンの前に 'ur' がある正規表現パターンを使用しようとしています。

4

1 に答える 1

1

印刷しようとするとx[1]

 print x[1]
 #output: Zayas de B?

data文字列をユニコードとして扱う場合。

data = u"&city=Zayas de Báscones;Zayas de Báscones;" # set it as unicode

印刷しようとするとx[1]

print x[1]
#output: Zayas de Báscones
于 2013-11-04T17:04:03.703 に答える