1

一連の html タグを繰り返し処理しようとしていますが、少しガイダンスが必要です。Beautiful Soup を使用して一連のテーブル行を反復処理し、リンク テキストを出力するにはどうすればよいですか?

HTML:

<div id="thisDiv">
    <table class="thisTable">
        <tr>
            <td><a href="blablabl">BLABLABLA1</a></td><td><a href="blablabla2">BLABLABLA2</a></td>
        </tr>
        <tr>
            <td><a href="blablab3">BLABLABLA3</a></td><td><a href="blablabla4">BLABLABLA4</a></td>
        </tr>
        <tr>
            <td><a href="blablab5">BLABLABLA5</a></td><td><a href="blablabla6">BLABLABLA6</a></td>
        </tr>
    </table>
</div>
4

1 に答える 1

1

行を反復処理する必要はありません。テーブルを見つけて、そこに含まれるすべてのアンカーを検索するだけです。

soup = BeautifulSoup(doc)
table = soup.find('table', {'class':'thisTable'}) 
for a in table.findAll('a'):
    print a.text
于 2012-12-23T22:58:21.323 に答える