このコードは、意図したとおりに機能しないため、少し問題があります。正規表現がこれを行うための最良の方法ではないことは知っていますが、htmlパーサーでそれを行う方法を理解できず、美しいスープはオプションではありません. これが私がやろうとしていることです。HTMLファイルがあり、間の値を抽出する必要があります
<div class="e_mail"> and </div>
以下のコードを使用すると、メールアドレスが返されます。
['returned@email.com']
括弧や引用符なしでメールアドレスを取得するにはどうすればよいですか? IDはむしろregよりもきれいなものを使用しますが、私が言ったようにhtmlパーサーを理解できませんでした。
f=urllib.urlopen('results.html')
s = str(f.read())
return re.compile('<div class="e_mail">(.*?)</div>', re.DOTALL).findall(s)