0

http://www.epicurious.com/recipes/food/reviews/Breaded-Chicken-Cutlets-aka-Grandma-Jodys-Chicken-51114400のレンダリングされたマークアップを取得しようとしています。理論的には、Firefox の [ページ ソースの表示] メニュー オプションによって提供されるマークアップとまったく同じです。

Python 2.7 スクリプトとhttplibライブラリ(http://docs.python.org/2/library/httplib.html)を使用しています。HTTPConnection オブジェクトを作成しましたが、HTTPResponse オブジェクトの関数を使用してマークアップを取得しようとすると、必然的にgetaddrinfo - 11004エラーが発生します。このスクリプトは、Windows 7 および Ubuntu 環境で実行されています。

私が読んだこのエラーの他の解決策はどれも法案に適合しませんでした.私はファイアウォールの背後にいるわけではなく、www.google.com. ターゲットのウェブサイトに ping を成功させることができなかったため、そのウェブサイトは私が知らない標準に準拠していないのではないかと考えています。

別のアプローチを受け入れます。より良い方法があれば教えてください。

4

1 に答える 1

0

reqestsライブラリをチェックアウトすることをお勧めします。これにより、次のような単純な作業がはるかに簡単になります。

import requests

r = requests.get('http://www.epicurious.com/recipes/food/reviews/Breaded-Chicken-Cutlets-aka-Grandma-Jodys-Chicken-51114400')

print r.text

ドキュメントは次のとおりです。http://docs.python-requests.org/en/latest/

上記を実行し、動作することを確認しました。

于 2013-01-15T02:18:03.530 に答える