python - ValueError: サポートされていないフォーマット文字 'a' (0x61) がインデックス 79 にあります

翻译自：https://stackoverflow.com/questions/19462465 2013-10-19T04:46:10.253

2975 次

美しいsoup4とpythonを使用して、Webサイトからデータをスクレイピングしようとしています。これが私のコードです

from bs4 import BeautifulSoup
import urllib2
i = 0
for i in xrange(0,38):
    page=urllib2.urlopen("http://www.sfap.org/klsfaprep_search?page={}&type=1&strname=&loc=&op=Lancer%20la%20recherche&form_build_id=form-72a297de309517ed5a2c28af7ed15208&form_id=klsfaprep_search_form" %i) 
    soup = BeautifulSoup(page.read())
    for eachuniversity in soup.findAll('div',{'class':'field-item odd'}):
        print ''.join(eachuniversity.findAll(text=True)).encode('utf-8')
    print ',\n'
i= i+ 1

問題は、指定した URL とインクリメントステートメントにあると思います。ページごとにスクレイピングできます。ただし、xrangeを指定した場合のみ。

python - ValueError: サポートされていないフォーマット文字 'a' (0x61) がインデックス 79 にあります

1 に答える 1

Related

Reference