5

次の方法を使用して、気象サイトから気温を取得しようとしています。

    import urllib2
from BeautifulSoup import BeautifulSoup

f = open('airport_temp.tsv', 'w')

f.write("Location" + "\t" + "High Temp (F)" + "\t" + "Low Temp (F)" + "\t" + "Mean Humidity" + "\n" )

eventually parse from http://www.wunderground.com/history/airport/\w{4}/2012/\d{2}/1/DailyHistory.html

for x in range(10):
    locationstamp = "Location " + str(x)
    print "Getting data for " + locationstamp
    url = 'http://www.wunderground.com/history/airport/KAPA/2013/3/1/DailyHistory.html'

    page = urllib2.urlopen(url)
    soup = BeautifulSoup(page)

    location = soup.findAll('h1').text
    locsent = location.split()
    loc = str(locsent[3,6]) 

    hightemp = soup.findAll('nobr')[6].text
    htemp = hightemp.split()
    ht = str(htemp[1]) 

    lowtemp = soup.findAll('nobr')[10].text
    ltemp = lowtemp.split()
    lt = str(ltemp[1]) 

    avghum = soup.findAll('td')[23].text

    f.write(loc + "\t|" + ht + "\t|" + lt + "\t|" + avghum + "\n" )

f.close()

残念ながら、次のようなエラーが発生します。

Getting data for Location 0
Traceback (most recent call last):
  File "airportweather.py", line 18, in <module>
    location = soup.findAll('H1').text
AttributeError: 'list' object has no attribute 'text'

BSとPythonのドキュメントを調べましたが、まだかなり環境に配慮しているため、理解できませんでした。この初心者を助けてください!

4

2 に答える 2

7

この.findAll()メソッドは、一致のリストを返します。1 つの結果が必要な場合は、.find()代わりに メソッドを使用してください。または、コードの残りの部分と同じように特定の要素を選択するか、結果をループします。

location = soup.find('h1').text

また

locations = [el.text for el in soup.findAll('h1')]

また

location = soup.findAll('h1')[2].text
于 2013-03-10T15:43:14.067 に答える
1

これは非常に簡単です。findAllリストを返すため、興味深い要素が1つしかないことが確実な場合は、次のようになりますsoup.findAll('H1')[0].text

于 2013-03-10T15:43:09.363 に答える