私を夢中にさせている問題があります。多くの URL を取得するために urllib2 を使用しています。HTMLページ全体が返される場合と返されない場合があるURLがあります。これは私のコードです:
def find_html(url):
req = urllib2.Request(url)
req.add_header('User-Agent', 'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-GB; rv:1.8.1.14) Gecko/20080404 Firefox/2.0.0.14')
page_html = urllib2.urlopen(req).read()
n = string.find(page_html, "filter clearfix active")
print "find element:",n
url = "http://it.hotels.com/ho113127/rome-cavalieri-waldorf-astoria-hotels-resorts-roma-italia/"
find_html(url)
なぜこうなった?私はどこで間違っていますか?(この URL にはセレンを使用したくなく、urllib2 を使用したい)