Twitterから次の文字列があるとしましょう:
"This is my sample test blah blah http://t.co/pE6JSwG, hello all"
このリンクをに変更して、この文字列を解析するにはどうすればよい<a href="link">link</a>
ですか?ユーザータグを解析するコードは次のとおりです。
tweet = s.text;
user_regex = re.compile(r'@[0-9a-zA-Z+_]*',re.IGNORECASE)
for tt in user_regex.finditer(tweet):
url_tweet = tt.group(0).replace('@','')
tweet = tweet.replace(tt.group(0),
'<a href="http://twitter.com/'+
url_tweet+'" title="'+
tt.group(0)+'">'+
tt.group(0)+'</a>')
そして、URLの現在の正規表現:
http_regex = re.compile(r'[A-Za-z]+:\/\/[A-Za-z0-9-_]+\.[A-Za-z0-9-_:%&\?\/.=]*', re.IGNORECASE)