次のタグから内部テキスト24,000.00だけを抽出したい:
<span class="itm-price mrs ">
<span data-currency-iso="BDT">৳</span>
<span dir="ltr" data-price="24000">24,000.00</span>
</span>
データを抽出したいページには、このような類似のタグがたくさんあります。
私はこれをやろうとしています:
for price in soup.find_all('span', {'class': 'itm-price'}):
item_price = price.get('data-price')
print(item_price)
しかし、出力が来ています:None
Bs4 doc
使用する必要があるhtml5data-*
タグのことから学びました:
data_soup.find_all(attrs={"data-foo": "value"})
# [<div data-foo="value">foo!</div>]
私はここでは非常に初心者なので、この方法を使用して結果を出すことはまだできません。