1

<img>コンテンツ内にあるリンクのみを印刷できるようにbeautifulSoupで設定することは可能ですか?

現在、私のコードは次のようになっています。

import urllib
import re
import mechanize
from bs4 import BeautifulSoup
import urlparse

url = "http://www.nytimes.com"

htmlcontent = urllib.urlopen(url)
soup = BeautifulSoup(htmlcontent)
for link in soup.find_all('a'):
    print link.contents

リンク内のすべてのコンテンツを出力します。しかし、私の真の必要性は、<img>コンテンツ内にタグを含むリンクを印刷することであり、その方法がわかりません...

どんな助けでも大歓迎です

4

1 に答える 1

1

imgリンク内のタグを見つけてみてください:

for link in soup.find_all('a'):
    if link.find('img'):
        print link
于 2013-08-02T13:29:18.080 に答える