したがって、ツイート/文字列内のすべてのユーザーの言及と URL を削除したいと考えています。
たとえば、次のようなツイートがあるとします。
@username1: some tweet here, http://www.url.com, aaaaa @username2
私はこのようなものを取得したい:
some tweet here, aaaaa
正規表現を使用したいのですが、Python は初めてで、その方法がわかりません。
また、ツイートは JSON ファイル (辞書のリスト) に保存され、各ツイート (辞書) には「entities」と呼ばれるキーがあり、「user_mentions」、「urls」、および「hashtags」に関する情報を次のような形式で保存します。以下:
{u'user_mentions': [{u'indices': [3, 18],
u'screen_name': u'username1',
u'id': 1234567,
u'name': u'user name 1',
u'id_str': u'1234567'},
{u'indices': [108, 116],
u'screen_name': u'username2',
u'id': 112233,
u'name': u'user name 2',
u'id_str': u'112233'}],
u'hashtags': [],
u'urls': [{u'url': u'http://www.url.com',
u'indices': [83, 103],
u'expanded_url': u'http://www.url.com',
u'display_url': u'http://www.url.com'}]
}
ユーザーのメンションと URL を削除する方法を知っている人はいますか? 本当にありがとう!