python - BeautifuSoup で html タグの内容を読み取る方法は?

Question

<td class="tag">
    <a href="/tag/android"  rel="tag">
         <img src="http://127.0.0.1/idf2.png" >
    android
    </a>          
</td>

コード：

soup = BeautifulSoup(html)
print html.td.a.string   # output None

BeautifulSoup4 のどのメソッド<a>がのコンテンツを取得できますかandroid

score 0 · Accepted Answer

それ.textは、ではありません.string:

>>>> soup.td.a.text.strip()
u'android'

stripそうしないと改行も含まれるため、私はそれをペディングしたことに注意してください。

aまた、テキストを抽出する必要がある正確なタグを見つける別の方法を検討する必要がありaます。ページには多くのタグがあり、この方法では最初のタグのみが取得される可能性があります。しかし、それはもちろん、適切なタグを見つけるために使用する基準によって異なります。

1 に答える 1