問題タブ [urllib]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
4934 参照

python - wget -c 機能を使用して Python で urllib を使用してファイルをダウンロードする

データベースからHTTP PDFをダウンロードするために、Pythonでソフトウェアをプログラミングしています。次のメッセージでダウンロードが停止することがあります。

206 Partial ContentHTTP 機能を使用して、停止したところからダウンロードを再開するにはどうすればよいですか?

を使用して実行できwget -c、かなりうまく機能しますが、Python ソフトウェアに直接実装したいと考えています。

何か案が ?

ありがとうございました

0 投票する
3 に答える
872 参照

python - Python 2.x で urllib を使用してリクエストを行うときにリクエスト ヘッダーを設定する方法はありますか?

urllib モジュールを使用して、Python 2.6.4 で HTTP リクエストを作成しようとしています。リクエストヘッダーを設定する方法はありますか?

これは urllib2 を使用して可能であると確信していますが、より単純に見えるので、urllib を使用することをお勧めします。

0 投票する
2 に答える
3414 参照

python - httplibを使用したPython応答の解析

ソケットに接続し、.read()を使用して応答をキャプチャした後、入力ストリームを解析して行を読み取るにはどうすればよいですか?

CRLFなしでデータが返されるのがわかります

0 投票する
2 に答える
9450 参照

python - Python: urllib2.urlopen(url, data) なぜデータを urllib.urlencode() しなければならないのですか?

post を使用したときに、post がすべての情報を HTTP ヘッダーで送信したと思いました (明らかに、この件について十分な情報がありません)。そのため、データをkey=value&key2=value2フォーマットに urlencode() する必要がある理由がわかりません。POST を使用する場合、そのフォーマットはどのように機能しますか?:

しかし

0 投票する
3 に答える
46644 参照

python - urllib2.HTTPErrorまたはurllib.error.HTTPErrorをオーバーライドし、とにかく応答HTMLを読み取ります

「HTTPエラー500:内部サーバーエラー」応答を受け取りましたが、それでもエラーHTML内のデータを読み取りたいと思います。

Python 2.6では、通常、次を使用してページをフェッチします。

失敗したURLでこれを使用しようとすると、例外が発生しますurllib2.HTTPError

urllib2内部サーバーエラーを返している間に、このようなエラーページ(の有無にかかわらず)を取得するにはどうすればよいですか?

Python 3では、対応する例外は。であることに注意してくださいurllib.error.HTTPError

0 投票する
7 に答える
8590 参照

python - urllib2に依存するモジュールをユニットテストするにはどうすればよいですか?

単体テストの方法がわからないコードがあります。このモジュールは、urllib2を使用して外部XMLフィード(twitter、flickr、youtubeなど)からコンテンツをプルします。これがそのためのいくつかの擬似コードです:

私の最初の考えは、応答をピクルスにしてテスト用にロードすることでしたが、どうやらurllibの応答オブジェクトはシリアル化できません(例外が発生します)。

私のコードはヘッダー情報も使用しているため、応答本文からXMLを保存するだけでは理想的ではありません。応答オブジェクトに作用するように設計されています。

そしてもちろん、単体テストでデータを外部ソースに依存することは恐ろしい考えです。

では、このための単体テストを作成するにはどうすればよいですか?

0 投票する
3 に答える
11682 参照

python - Python と URLlib

urllib を使用して ftp国勢調査サイトから zip ファイル ("tl_2008_01001_edges.zip") をダウンロードしようとしています。入手した zip ファイルの形式と保存方法を教えてください。

私は Python にかなり慣れていないため、urllib の仕組みがわかりません。

これは私の試みです:

ftp フォルダー (この場合は郡) のリストがわかっている場合、glob 関数を使用して ftpサイトのリストを調べることはできますか?

ありがとう。

0 投票する
2 に答える
170 参照

python - Web サイトの検索

エクスプロイト db.com サイトを検索すると、25 件の結果しか表示されません。別のページに移動したり、25 件の結果を渡したりするにはどうすればよいですか。

0 投票する
5 に答える
12272 参照

python - Urlretrieve とユーザーエージェント? - パイソン

urllib モジュールの urlretrieve を使用しています。

リクエストに User-Agent の説明を追加する方法が見つからないようです。


urlretrieve で可能ですか? または、別の方法を使用する必要がありますか?

0 投票する
1 に答える
1355 参照

python - urllib は認証要求を無視します

URL を操作するスクリプトの作成にほとんど問題はありません。urllib.urlopen() を使用して、目的の URL のコンテンツを取得しています。ただし、これらの URL の一部では認証が必要です。urlopen は、ユーザー名とパスワードを入力するように求めます。認証が必要なすべての URL を無視し、簡単にスキップして続行する必要があります。これを行う方法はありますか? HTTPError の例外をキャッチしようかと思っていたのですが、実は例外は urlopen() メソッドで処理されているのでうまくいきません。

返信ありがとうございます。