0
<td class="tag">
    <a href="/tag/android"  rel="tag">
         <img src="http://127.0.0.1/idf2.png" >
    android
    </a>          
</td>

コード:

soup = BeautifulSoup(html)
print html.td.a.string   # output None

BeautifulSoup4 のどのメソッド<a>が のコンテンツを取得できますかandroid

4

1 に答える 1

0

それ.textは、ではありません.string:

>>>> soup.td.a.text.strip()
u'android'

stripそうしないと改行も含まれるため、私はそれをペディングしたことに注意してください。

aまた、テキストを抽出する必要がある正確なタグを見つける別の方法を検討する必要がありaます。ページには多くのタグがあり、この方法では最初のタグのみが取得される可能性があります。しかし、それはもちろん、適切なタグを見つけるために使用する基準によって異なります。

于 2013-06-07T14:19:34.923 に答える