0

私はこの文字列を持っています:

p = "{u'symbols': [], u'user_mentions': [{u'indices': [0, 9], u'id': 1425561991, u'id_str': u'1425561991', u'name': u'h u2661', u'screen_name': u'oppsli4m'}, {u'indices': [10, 23], u'id': 27260086, u'id_str': u'27260086', u'name': u'Justin Bieber', u'screen_name': u'justinbieber'}], u'hashtags': [], u'urls': []}"

ご覧のとおり、すべての文字列の前に「Unicode 文字」があります。uだから、の前にある場合はすべて削除したい'

私は試した :

vals = re.split('u', p)

そして、この表現の他のいくつかのバリエーション。しかし、運がありませんでした。

私の質問が明確であることを願っていますが、念のため、取得したい結果は次のようになります。

"{'symbols': [], 'user_mentions': [{'indices': [0,9], 'id': 124......"
4

2 に答える 2

6

いいえ、あなたはこれをしたくありません。

そもそもその文字列を丸くするべきではありません。どこから来たのかはわかりませんが、誰かがstrリストに電話をかけたようです. 代わりに、JSON などの適切なシリアル化方法を使用する必要があります。

于 2013-05-23T15:28:19.863 に答える
2

これがあなたが探しているものだと思います:

import re
print re.sub(r"u('\w)", r"\1", p)
于 2013-05-23T15:26:43.520 に答える