私はbeautifulsoupを使用して、html文字列から画像とリンクを抽出しています。それはすべて完全に正常に機能しますが、リンクの内容にタグが含まれている一部のリンクではエラーが発生します。
リンクの例:
<a href="http://www.example.com"><strong>Link Text</strong></a>
Pythonコード:
soup = BeautifulSoup(contents)
links = soup.findAll('a')
for link in links:
print link.contents # generates error
print str(link.contents) # outputs [Link Text]
エラーメッセージ:
TypeError: sequence item 0: expected string, Tag found
リンクテキスト内の子タグをループする必要はありません。生のコンテンツを返したいだけです。これはBSで可能ですか?