python - bs4を使用してXML Webサイトをスクレイピングする方法は?

Question

電子製品を販売する Web サイトを解析しています。具体的には、xml ベースのサイトを解析しているときに小さな問題に遭遇した製品の名前と価格を収集しようとしています。

これが私のコードです：

>>> import urllib2  
>>> from bs4 import BeautifulSoup  
>>> url=urllib2.urlopen("http://store.explorelabs.com/index.php?main_page=products_all")  
>>> soup=BeautifulSoup(url,"xml")  
>>> data=soup.find_all(colspan="2")

これを行うと、上記のコードが機能するよう
になりました（名前が強力なタグ内にあるため）

>>> data.strong

また

>>> data.attrs

それは私にこれを示しています：

Traceback (most recent call last):  
  File "<pyshell#10>", line 1, in <module>  
    data.strong  
AttributeError: 'ResultSet' object has no attribute 'strong'

また

Traceback (most recent call last):  
  File "<pyshell#17>", line 1, in <module>  
    data.find_all('a')  
AttributeError: 'ResultSet' object has no attribute 'find_all'

私は繰り返し、より多くを見つけようとしています。
どんな指針も非常に役に立ちます。

score 1 · Accepted Answer

find_all1 つではなく、一致する要素のリストを返します。結果セットをループして、個々の項目を取得します。

for element in data:
    element.attrs

python - bs4を使用してXML Webサイトをスクレイピングする方法は?

1 に答える 1

Related

Reference