python - テキストを拾う BeautifulSoup の使い方

翻译自：https://stackoverflow.com/questions/19924649 2013-11-12T08:49:51.443

133 次

(私は Python の初心者です。BeautifulSoup DOC を読んでください。ただし、使用方法はまだわかりません)。

BeautifulSoup を使用して Web ページから情報を抽出しようとしています。

Web ページの HTML ソースコードには次のものが含まれます。

<TD class=genmed align=left><A href="http://m.harveynorman.com.au/ipod-shuffle-2gb.html">1015362</A></TD>

<TD class=genmed align=left><A href="http://m.harveynorman.com.au/ipod-touch-16gb-black-and-silver.html">1056332</A></TD>

<TD class=genmed align=left><A href="http://m.harveynorman.com.au/ipod-nano-16gb.html">1016552</A></TD>

「 http:// 」で始まる Web リンクのすべてのテキストと、数字1015362、1056332、1016552を抽出したいと考えています。

コードの一部は次のとおりです。

AA = soup.findAll(text="http:")
for BB in AA:
    print BB.renderContents()

BeautifulSoup に必要なテキストをピックアップさせるにはどうすればよいですか?

python - テキストを拾う BeautifulSoup の使い方

1 に答える 1

Related

Reference