これは私のサンプルスクリプトです:
import urllib2, re
response = urllib2.urlopen('http://domain.tld/file')
data = response.read() # Normally displays "the emoticon <3 is blah blah"
pattern = re.search('(the emoticon )(.*)( is blah blah)', data)
result = pattern.group(2) # result should contain "<3" now
print 'The result is ' + result # prints "<3" because not encoded
ご覧のとおり、ページを取得して文字列を取得しようとしていますが、このスクリプトに何を追加すればよいかわからないため、正しくエンコードされていません。誰かが私が間違っていることを指摘できますか?