(私は Python の初心者です。BeautifulSoup DOC を読んでください。ただし、使用方法はまだわかりません)。
BeautifulSoup を使用して Web ページから情報を抽出しようとしています。
Web ページの HTML ソース コードには次のものが含まれます。
<TD class=genmed align=left><A href="http://m.harveynorman.com.au/ipod-shuffle-2gb.html">1015362</A></TD>
<TD class=genmed align=left><A href="http://m.harveynorman.com.au/ipod-touch-16gb-black-and-silver.html">1056332</A></TD>
<TD class=genmed align=left><A href="http://m.harveynorman.com.au/ipod-nano-16gb.html">1016552</A></TD>
「 http:// 」で始まる Web リンクのすべてのテキストと、数字1015362、1056332、1016552を抽出したいと考えています。
コードの一部は次のとおりです。
AA = soup.findAll(text="http:")
for BB in AA:
print BB.renderContents()
BeautifulSoup に必要なテキストをピックアップさせるにはどうすればよいですか?