3

以下を使用してページのソースコードを取得しようとしています:

import urllib2
url="http://france.meteofrance.com/france/meteo?PREVISIONS_PORTLET.path=previsionsville/750560"
page =urllib2.urlopen(url)
data=page.read()
print data

また、を使用してもuser_agent(headers) 、ページのソース コードを取得できませんでした。

何ができるか考えていますか?前もって感謝します

4

3 に答える 3

2

requestsマーティン・メイラードが示したように、ライブラリは私にとってはうまくいきました。

また、別のスレッドで、こちらのleoluk によるこのメモに気付きました。

編集: 現在は 2014 年であり、重要なライブラリのほとんどが移植されているため、可能であれば Python 3 を使用する必要があります。python-requests は、urllib2 よりも使いやすい非常に優れた高レベル ライブラリです。

そこで、次の get_page プロシージャを作成しました。

import requests
def get_page (website_url):
    response = requests.get(website_url)
    return response.content

print get_page('http://example.com')

乾杯!

于 2015-01-11T16:04:54.247 に答える
0

「urllib」「urllib2」など、多くのことを試しましたが、1 つの方法で必要なものすべてに対応し、直面した問題を解決できました。Mechanizeでした。このライブラリは実際のブラウザを使用してシミュレートするため、その領域の問題を多く処理します。

于 2013-07-03T17:00:20.157 に答える