“urlopen”の関連問題_Stack Overflow日本語サイト

0 投票する

2 に答える

1120 参照

python - ページから取得したテキストが意味不明に見えることがあるのはなぜですか?

Python で urllib と urllib2 を使用して Web ページを開いたり読んだりしていますが、取得したテキストが読めないことがあります。たとえば、これを実行すると:

読めないテキストが表示されます。私はこれらの投稿を読みました：

urlopen から意味不明

Python urllib2 は Web ページから取得した gzip データを自動的に解凍しますか?

しかし、私の答えが見つからないようです。

よろしくお願いします。

更新：ユーザーエージェントがクローラーではなくブラウザーであることをサーバーに「納得させる」ことで問題を修正しました。

返信ありがとうございます。

2011-11-25T15:54:28.950

0 投票する

2 に答える

935 参照

python - Python: urllib.urlopen での KeyError/IOError

次のように、この可読性 APIにテキストを渡そうとしています。

ただし、最後の行でこのエラーが発生します。

[Errno 2] そのようなファイルまたはディレクトリはありません: 'http://ipeirotis.appspot.com/readability/GetReadabilityScores?format=json&text=this+reminds+me+of+the+Dutch+2001a+caravan+full+of+smoky +人+Auld+Lang+Syne'

ただし、エラーの URL は有効であり、アクセスすると応答が返されます。urlopen を使用できるように URL をエンコードするにはどうすればよいですか? どうもありがとう。

python json urllib urlopen

2011-12-04T17:54:10.400

0 投票する

1 に答える

861 参照

python - タイムアウト後に終了しないタイムアウト付きのurlopen呼び出し

Python 2.4.4 ではurllib2.urlopen()、リソースを要求するために使用しています。リクエストを行う前に、次のようにタイムアウトを設定しています。

(このバージョンの Python は古すぎて、urlopen()ビルトインタイムアウト付きのバージョンはありません。)

ほとんどの場合、これでうまくいくようです。ただし、要求に応じてハングするサーバーに遭遇しました。Chrome では、ブラウザがあきらめて次のように言うまでに 5 分近くかかります。

SERVERNAME の応答に時間がかかりすぎたため、Google Chrome はウェブページを読み込めませんでした。Web サイトがダウンしているか、インターネット接続に問題が発生している可能性があります。

Python では、urlopen短いタイムアウトを設定しているにもかかわらず、リクエストが無期限にハングしているように見えます。正確には何がsocket.setdefaulttimeout()制御され、これらの接続にハードタイムアウトを強制する方法はありますか (他に何が起こっているかに関係なく、10 秒が経過すると、試行を終了します)?

python sockets timeout urllib2 urlopen

2011-12-09T21:08:31.557

0 投票する

1 に答える

304 参照