-3

API から json データを受け取ります。

json = {"lat": null, "body_text": "@edinburgh \u2764\ufe0f", "deduplicated_time": "2020-11-05T15:38:11.744710"}

Python を使用して json メッセージを読み込みます。

msg_body = json.loads(msg.body,strict=False)

VaderSentiment を使用して、json メッセージの body_text セクションのテキストからセンチメントを抽出します。

問題は、赤いハート ❤ 絵文字がテキストに \u2764\ufe0f として含まれている場合、Vader が正しい感情を予測できないことです。彼らのページでは、vader が や などの utf-8 でエンコードされた絵文字を翻訳していることを示唆しています。\u2764\ufe0f は UTF-8 ではないと思いますが、Python を使用して UTF-8 にするにはどうすればよいですか?

次のページの絵文字が正しい場合、\u2764\ufe0f は "python src" エンコーディングです。

4

1 に答える 1