python - BeautifulSoup でこれらの値を取得するには?

Question

私は以下を解析しようとしていますHTML:

<div class="content">
    <h3>
                                Kontaktuppgifter</h3>
    <table>
        <tr>
            <th>
                Postadress:
            </th>
            <td>
                Platteb....
                <br/>44497 SVE....
            </td>
        </tr>
        <tr>
            <th>
                Telefon:
            </th>
            <td>
                01-.......

            </td>
        </tr>
    </table>

をつかみたいのですがtd 1、常に存在するとは限りませんtd 2。td 3td 3

これは私がこれまでに得たものです:

def ParsePage(threadName, page_url):
    r  = requests.get(page_url)
    print "\n--------------------\n"
    print "Parsing page: " + r.url
    data = r.text
    soup = BeautifulSoup(data)

    divs = soup.findAll('div', { "class" : "content" })
    for tag in divs:
        divds = tag.findAll('td')   
        print divds

何らかの理由で、これはdiv全体を印刷するだけです

score 1 · Accepted Answer

あなたはどこかにタイプミスがあるに違いありません、コードは私のために働いた：

from bs4 import BeautifulSoup

soup = BeautifulSoup(your_html)
div = soup.findAll("div", {"class": "content"})

for tag in div: print tag.findAll("td")
#printed:
[<td>
                Platteb....
                <br/>44497 SVE....
            </td>, <td>
                01-.......

            </td>]

python - BeautifulSoup でこれらの値を取得するには?

1 に答える 1

Related

Reference