1

みなさん、こんにちは。Web サイトからデータを抽出し、日付を sqlite3 に保存する必要がある python スクリプトを実行しています。コンテンツ抽出で問題が発生しました。ここに私がしたコードがあります

#!/usr/bin/python
from BeautifulSoup import BeautifulSoup
import urllib2
import re

url="http://m.harveynorman.com.au/tv-audio/portable-audio/ipods"
page=urllib2.urlopen(url)
soup = BeautifulSoup(page.read())
A=soup.findAll('strong',{'class':'name fn'})
for B in A:

   print = B.renderContents()

出力は次のようになります。

 "iPod touch 16GB - White   
   iPod touch 4th Gen 32GB  
 Apple iPod Shuffle 2GB  
 iPod touch 16GB - Black  
 iPod nano 16GB  
  iPod touch 32GB"   

そして私は使用しようとします

   print = B.renderContents()[0]

sqlite3 に挿入するものを指定しますが、出力は次のようになります。

i 
i
A
i
i
i

だから私の質問は、どのように特定のものを抽出することができますか(iPod touch 16GB - ホワイトなど)???

4

1 に答える 1

0
from BeautifulSoup import BeautifulSoup
import urllib2
import re

url="http://m.harveynorman.com.au/tv-audio/portable-audio/ipods"
page=urllib2.urlopen(url)
soup = BeautifulSoup(page.read())
A = soup.findAll('strong',{'class':'name fn'})[0]
print(A.renderContents())

収量

iPod touch 16GB - White

for B in A:
    print B.renderContents()[0]

の各行の最初の文字を印刷しています

iPod touch 16GB - White
iPod touch 4th Gen 32GB
Apple iPod Shuffle 2GB
iPod touch 16GB - Black
iPod nano 16GB
iPod touch 32GB
于 2013-05-30T19:36:55.247 に答える