電子製品を販売する Web サイトを解析しています。具体的には、xml ベースのサイトを解析しているときに小さな問題に遭遇した製品の名前と価格を収集しようとしています。
これが私のコードです:
>>> import urllib2
>>> from bs4 import BeautifulSoup
>>> url=urllib2.urlopen("http://store.explorelabs.com/index.php?main_page=products_all")
>>> soup=BeautifulSoup(url,"xml")
>>> data=soup.find_all(colspan="2")
これを行うと、上記のコードが機能するよう
になりました(名前が強力なタグ内にあるため)
>>> data.strong
また
>>> data.attrs
それは私にこれを示しています:
Traceback (most recent call last):
File "<pyshell#10>", line 1, in <module>
data.strong
AttributeError: 'ResultSet' object has no attribute 'strong'
また
Traceback (most recent call last):
File "<pyshell#17>", line 1, in <module>
data.find_all('a')
AttributeError: 'ResultSet' object has no attribute 'find_all'
私は繰り返し、より多くを見つけようとしています。
どんな指針も非常に役に立ちます。