私はこの小さなクラスを持っています:
class HTMLTagStripper(HTMLParser):
def __init__(self):
self.reset()
self.fed = []
def handle_data(self, data):
self.fed.append(data)
def handle_starttag(self, tag, attrs):
if tag == 'a':
return attrs[0][1]
def get_data(self):
return ''.join(self.fed)
この HTML コードの解析:
<div id="footer">
<p>long text.</p>
<p>click <a href="somelink.com">here</a>
</div>
これは私が得る結果です:long text click here
しかし、私は取得したい:long text click somelink.com
これを行う方法はありますか?