私はjb hifiから特定の情報を抽出しようとしています.これが私がしたことです:
from BeautifulSoup import BeautifulSoup
import urllib2
import re
url="http://www.jbhifionline.com.au/support.aspx?post=1&results=10&source=all&bnSearch=Go!&q=ipod&submit=Go"
page=urllib2.urlopen(url)
soup = BeautifulSoup(page.read())
Item0=soup.findAll('td',{'class':'check_title'})[0]
print (Item0.renderContents())
出力は次のとおりです。
Apple iPod Classic 160GB (Black)Â
<span class="SKU">MC297ZP/A</span>
私が欲しいのは:
Apple iPod Classic 160GB (Black)
re を使用して他の情報を削除しようとしました
print(Item0.renderContents()).replace{^<span:,""}
しかし、うまくいきませんでした
だから私の問題は、無駄な情報を削除して「Apple ipod classic 160GB(black)」を取得するにはどうすればよいかということです