私はPythonを使用してWeibo(中国のTwitterのようなサービス)の文を処理しています。文にはいくつかの絵文字があり、対応するユニコード\ue317
などがあります。文を処理するには、gbkで文をエンコードする必要があります。以下を参照してください。
string1_gbk = string1.decode('utf-8').encode('gb2312')
ありますUnicodeEncodeError:'gbk' codec can't encode character u'\ue317'
試し\\ue[0-9a-zA-Z]{3}
ましたが、うまくいきませんでした。これらの絵文字を文章でどのように一致させることができますか?