美しいスープでhtmlツリーをトラバースするのを手伝ってくれる人はいますか?
Tld
HTML出力を解析して、各値を収集した後、python/djangoという名前のテーブルに挿入しようとしています
<div class="rc" data-hveid="53">
<h3 class="r">
<a href="https://billing.anapp.com/" onmousedown="return rwt(this,'','','','2','AFQjCNGqpb38ftdxRdYvKwOsUv5EOJAlpQ','m3fly0i1VLOK9NJkV55hAQ','0CDYQFjAB','','',event)">Billing: Portal Home</a>
</h3>
href
の属性の値のみを解析する<a>
ため、この部分のみ:
https://billing.anapp.com/
の:
<a href="https://billing.anapp.com/" onmousedown="return rwt(this,'','','','2','AFQjCNGqpb38ftdxRdYvKwOsUv5EOJAlpQ','m3fly0i1VLOK9NJkV55hAQ','0CDYQFjAB','','',event)">Billing: Portal Home</a>
私は現在持っています:
for url in urls:
mb.open(url)
beautifulSoupObj = BeautifulSoup(mb.response().read())
beautifulSoupObj.find_all('h3',attrs={'class': 'r'})
問題は上記にあり、要素find_all
まで十分に離れていません。<a>
どんな助けでも大歓迎です。ありがとうございました。