python - Python でページのソースコードを取得できません

Question

以下を使用してページのソースコードを取得しようとしています:

import urllib2
url="http://france.meteofrance.com/france/meteo?PREVISIONS_PORTLET.path=previsionsville/750560"
page =urllib2.urlopen(url)
data=page.read()
print data

また、を使用してもuser_agent(headers) 、ページのソースコードを取得できませんでした。

何ができるか考えていますか？前もって感謝します

score 2 · Accepted Answer

requestsマーティン・メイラードが示したように、ライブラリは私にとってはうまくいきました。

また、別のスレッドで、こちらの leoluk によるこのメモに気付きました。

編集: 現在は 2014 年であり、重要なライブラリのほとんどが移植されているため、可能であれば Python 3 を使用する必要があります。python-requests は、urllib2 よりも使いやすい非常に優れた高レベルライブラリです。

そこで、次の get_page プロシージャを作成しました。

import requests
def get_page (website_url):
    response = requests.get(website_url)
    return response.content

print get_page('http://example.com')

乾杯！

score 0 · Accepted Answer

「urllib」「urllib2」など、多くのことを試しましたが、1 つの方法で必要なものすべてに対応し、直面した問題を解決できました。Mechanizeでした。このライブラリは実際のブラウザを使用してシミュレートするため、その領域の問題を多く処理します。

python - Python でページのソース コードを取得できません

3 に答える 3

Related

Reference

python - Python でページのソースコードを取得できません